IBM đã ra mắt Granite 4.0 - một gia đình mới của các mô hình ngôn ngữ trọng số mở có kích thước từ 3B đến 32B. Artificial Analysis đã được cung cấp quyền truy cập trước khi phát hành, và các bài kiểm tra của chúng tôi cho thấy Granite 4.0 H Small (32B/9B tổng/số tham số hoạt động) đạt được chỉ số trí tuệ 23, với một điểm mạnh đặc biệt trong hiệu quả token. Hôm nay, IBM đã phát hành bốn mô hình mới: Granite 4.0 H Small (32B/9B tổng/số tham số hoạt động), Granite 4.0 H Tiny (7B/1B), Granite 4.0 H Micro (3B/3B) và Granite 4.0 Micro (3B/3B). Chúng tôi đã đánh giá Granite 4.0 Small (trong chế độ không lý luận) và Granite 4.0 Micro bằng cách sử dụng chỉ số trí tuệ Artificial Analysis. Các mô hình Granite 4.0 kết hợp một lượng nhỏ các lớp chú ý kiểu transformer tiêu chuẩn với phần lớn các lớp Mamba, mà theo tuyên bố, giảm yêu cầu bộ nhớ mà không ảnh hưởng đến hiệu suất. Những điểm chính từ bài kiểm tra: ➤🧠 Trí tuệ Granite 4.0 H Small: Trong chế độ không lý luận, Granite 4.0 H Small đạt 23 trên chỉ số trí tuệ Artificial Analysis - một bước nhảy +8 điểm trên chỉ số so với IBM Granite 3.3 8B (Không Lý Luận). Granite 4.0 H Small đứng trước Gemma 3 27B (22) nhưng đứng sau Mistral Small 3.2 (29), EXAONE 4.0 32B (Không Lý Luận, 30) và Qwen3 30B A3B 2507 (Không Lý Luận, 37) về trí tuệ. ➤⚡ Trí tuệ Granite 4.0 Micro: Trên chỉ số trí tuệ Artificial Analysis, Granite 4.0 Micro đạt 16. Nó đứng trước Gemma 3 4B (15) và LFM 2 2.6B (12). ➤⚙️ Hiệu quả token: Granite 4.0 H Small và Micro thể hiện hiệu quả token ấn tượng - Granite 4.0 Small sử dụng 5.2M, trong khi Granite 4.0 Micro sử dụng 6.7M token để chạy chỉ số trí tuệ Artificial Analysis. Cả hai mô hình sử dụng ít token hơn Granite 3.3 8B (Không Lý Luận) và hầu hết các mô hình mở không lý luận khác nhỏ hơn 40B tổng số tham số (trừ Qwen3 0.6B sử dụng 1.9M token đầu ra). Chi tiết mô hình chính: ➤🌐 Sẵn có: Tất cả bốn mô hình đều có sẵn trên Hugging Face. Granite 4.0 H Small có sẵn trên Replicate và có giá $0.06/$0.25 cho mỗi 1M token đầu vào/đầu ra. ➤📏 Cửa sổ ngữ cảnh: 128K token. ➤©️ Giấy phép: Các mô hình Granite 4.0 có sẵn theo giấy phép Apache 2.0.
Hiệu suất token đầu ra và giá mỗi token của Granite 4.0 H Small’s (Không Lý luận) cung cấp một sự trao đổi hấp dẫn giữa trí tuệ và Chi phí Vận hành Chỉ số Phân tích Trí tuệ Nhân tạo.
Trong danh mục các mô hình Open Weights Non-Reasoning nhỏ hơn 40B tổng số tham số, Granite 4.0 H Small đang ở ranh giới giữa trí tuệ và Số Token Đầu Ra được Sử Dụng trong Chỉ Số Trí Tuệ Phân Tích Nhân Tạo.
Trong danh mục các mô hình Open Weights Non-Reasoning nhỏ hơn 4B tổng số tham số, Granite 4.0 Micro đang ở ranh giới giữa trí tuệ và Số Token Đầu Ra Sử Dụng trong Chỉ Số Trí Tuệ Phân Tích Nhân Tạo.
So sánh hiệu suất của các mẫu Granite 4.0 với các mẫu khác mà bạn đang sử dụng hoặc đang xem xét tại:
32,63K