Điểm làm BitNet nổi bật không chỉ là kiến trúc đơn giản mà còn là khả năng hoạt động trực tiếp trên CPU phổ biến, kể cả chip Apple M2
Microsoft vừa gây bất ngờ khi ra mắt BitNet b1.58 2B4T – một mô hình ngôn ngữ lớn mới có khả năng chạy mượt mà mà không cần GPU cao cấp. Với thiết kế siêu nhẹ cùng thuật toán ternary quantization, chỉ dùng -1, 0 hoặc +1 cho mỗi trọng số, BitNet đánh dấu bước tiến lớn trong việc phát triển AI tiết kiệm tài nguyên mà vẫn hiệu quả.
Trong khi các mô hình AI hiện nay thường sử dụng số thực 16 hoặc 32 bit cho mỗi trọng số, khiến mô hình nặng nề và tốn tài nguyên, BitNet chỉ cần 1.58 bit cho mỗi trọng số. Nhờ đó, toàn bộ mô hình chỉ chiếm khoảng 400MB bộ nhớ – bằng 1/3 so với các mô hình cùng quy mô như LLaMA 3.2 1B, Gemma 3 1B hay Qwen 2.5 1.5B.

Dù trọng số có độ chính xác thấp, BitNet vẫn được huấn luyện trên bộ dữ liệu khổng lồ với 4 nghìn tỷ tokens – tương đương 33 triệu cuốn sách. Điều này giúp nó xử lý hiệu quả các nhiệm vụ từ bài toán tiểu học đến các câu hỏi suy luận. Trong một số bài đánh giá, BitNet còn vượt mặt những đối thủ cùng tầm về độ chính xác và tốc độ.
Không chỉ có kiến trúc đơn giản, BitNet còn có thể chạy trực tiếp trên các CPU phổ thông, kể cả Apple M2. Microsoft đã phát triển riêng framework bitnet.cpp, được tối ưu cho mô hình này, cho phép nó hoạt động trơn tru mà không cần các thư viện AI nặng như Hugging Face Transformers.
BitNet b1.58 2B4T cho thấy tiềm năng lớn trong việc đưa AI mạnh mẽ lên các thiết bị cá nhân, loại bỏ nhu cầu dựa vào trung tâm dữ liệu hay dịch vụ đám mây đắt đỏ. Theo ước tính từ nhóm phát triển, mô hình này tiêu tốn ít năng lượng hơn từ 85 đến 96% so với các mô hình AI dùng full-precision hiện nay.
Dù vẫn tồn tại một vài hạn chế như cần framework riêng để vận hành, khả năng hỗ trợ phần cứng còn hạn chế và độ dài ngữ cảnh ngắn hơn so với các mô hình dẫn đầu, BitNet vẫn đang chứng minh một hướng đi mới cho AI: tinh gọn – tiết kiệm – dễ tiếp cận, thay vì chạy theo xu hướng càng lớn càng tốt.
BitNet là minh chứng cho triết lý của Microsoft: đôi khi, chính sự đơn giản lại là chìa khóa để tiến xa hơn.
