VTV.vn - Mô hình AI mới từ Microsoft hé lộ tiềm năng lớn cho việc ứng dụng trên các thiết bị tiết kiệm tài nguyên như điện thoại, laptop siêu mỏng hoặc thiết bị nhúng.
Theo TechCrunch, Microsoft vừa ra mắt BitNet b1.58 2B4T - mô hình AI "1-bit" lớn nhất từng được huấn luyện, mở ra hướng phát triển mới cho AI tiết kiệm tài nguyên. Điểm sáng của BitNet là khả năng hoạt động hoàn toàn bằng CPU, kể cả các dòng tiết kiệm năng lượng như Apple M2, thay vì phụ thuộc vào GPU cao cấp. Đặc biệt, mô hình này được phát hành theo giấy phép mã nguồn mở MIT.
BitNet là gì và nó khác biệt như thế nào so với các mô hình AI truyền thống?
Nhờ thiết kế gọn nhẹ và tối ưu, BitNet b1.58 2B4T được xem là lựa chọn lý tưởng để triển khai trên các thiết bị phần cứng giới hạn như smartphone, laptop mỏng nhẹ hoặc các thiết bị IoT, nơi GPU không thể sử dụng được.
Trái với các mô hình AI truyền thống cần 16 hoặc 32 bit để biểu diễn mỗi trọng số, BitNet chỉ sử dụng -1, 0 và 1. Nhờ vậy, toàn bộ trọng số có thể mã hóa chỉ bằng 1 đến 2 bit, giúp giảm mạnh dung lượng bộ nhớ và tăng tốc xử lý ngay cả trên CPU phổ thông.

Mô hình AI mới của Microsoft mở ra cơ hội lớn cho việc áp dụng AI trên các thiết bị tiêu tốn ít tài nguyên như smartphone, laptop mỏng hoặc thiết bị nhúng, thay vì phụ thuộc vào các hệ thống GPU đắt tiền như hiện nay
BitNet b1.58 2B4T sở hữu 2 tỷ tham số – con số không quá ấn tượng so với các mô hình hiện đại – nhưng lại được huấn luyện trên bộ dữ liệu khổng lồ 4 nghìn tỷ token, tương đương khoảng 33 triệu cuốn sách. Nhờ đó, BitNet vẫn đạt hiệu suất xuất sắc trong các bài test benchmark quan trọng như GSM8K (giải toán tiểu học) và PIQA (suy luận vật lý trong đời sống).
Trong các bài so sánh hiệu suất, BitNet vượt mặt loạt đối thủ cùng phân khúc như Meta Llama 3.2 1B, Google Gemma 3 1B và Alibaba Qwen 2.5 1.5B, không chỉ ở độ chính xác mà còn ở tốc độ xử lý và khả năng tiết kiệm bộ nhớ. Báo cáo cho thấy BitNet nhanh gấp đôi trong khi tiêu tốn ít RAM hơn đáng kể.
Dù có nhiều ưu điểm về hiệu năng và tính linh hoạt, BitNet hiện chỉ hoạt động hiệu quả trên bitnet.cpp – framework chuyên dụng do Microsoft phát triển. Mô hình chưa hỗ trợ GPU, gây khó khăn khi muốn huấn luyện hoặc triển khai ở quy mô lớn, nhất là khi hạ tầng AI hiện nay chủ yếu dựa trên GPU.
Tuy nhiên, khả năng vận hành mượt mà trên CPU lại là một lợi thế lớn trong bối cảnh nhu cầu triển khai AI trên thiết bị phổ thông ngày càng tăng. BitNet mở ra cơ hội đưa AI đến gần hơn với người dùng phổ thông – những người không có phần cứng cao cấp nhưng vẫn muốn trải nghiệm AI tiết kiệm năng lượng và chi phí.
Nếu trong tương lai BitNet mở rộng hỗ trợ phần cứng và tương thích với các nền tảng phổ biến như GPU, mô hình AI 1-bit này có thể đóng vai trò quan trọng trong việc đưa AI ra khỏi phòng thí nghiệm, tiến vào đời sống thường nhật theo cách đơn giản, hiệu quả và tiết kiệm nhất.
