VTV.vn - Máy chủ AI mới của Nvidia mạnh mẽ hơn gấp 10 lần, được tối ưu cho mô hình MoE và cạnh tranh trực tiếp với các sản phẩm của AMD.

Logo của Tập đoàn Nvidia. Ảnh: Getty Images/TTXVN
Vào ngày 3/12, Nvidia đã công bố dữ liệu mới nhất, cho thấy rằng máy chủ AI mới của hãng có thể nâng cao hiệu suất của các mô hình AI tiên tiến, bao gồm những mô hình phổ biến từ Trung Quốc, lên đến 10 lần so với các thế hệ máy chủ trước đó.
Dữ liệu này được công bố trong bối cảnh ngành AI đang dần chuyển trọng tâm từ huấn luyện mô hình (lĩnh vực mà Nvidia đang dẫn đầu) sang việc triển khai mô hình cho hàng triệu người dùng. Đây là lĩnh vực đang chứng kiến sự gia tăng cạnh tranh từ các đối thủ như Advanced Micro Devices (AMD) và Cerebras.
Nvidia cho biết những cải tiến này chủ yếu đến từ khả năng tích hợp một lượng lớn các chip vào một máy chủ duy nhất cùng các kết nối tốc độ cao giữa chúng, lĩnh vực mà hãng vẫn đang dẫn đầu và duy trì lợi thế vượt trội so với các đối thủ. Máy chủ AI mới của Nvidia được trang bị 72 chip cao cấp của hãng.
Dữ liệu mà Nvidia công bố chủ yếu tập trung vào các mô hình AI sử dụng kiến trúc Mixture-of-Experts (MoE), một phương pháp tối ưu hóa hiệu quả hoạt động của các mô hình AI bằng cách phân chia công việc thành các phần riêng biệt và giao cho các "chuyên gia" khác nhau trong mô hình xử lý. Kiến trúc MoE trở nên phổ biến vào năm 2025, đặc biệt sau khi DeepSeek - một công ty AI của Trung Quốc, giới thiệu mô hình nguồn mở hiệu suất cao, yêu cầu ít thời gian huấn luyện trên các chip của Nvidia so với đối thủ.
Do đó, các công ty lớn như OpenAI (nhà sản xuất ), Mistral từ Pháp và Moonshot AI của Trung Quốc đã bắt đầu áp dụng phương pháp MoE vào các mô hình của họ. Vào tháng 7 vừa qua, Moonshot AI đã ra mắt một mô hình nguồn mở được đánh giá cao, sử dụng kỹ thuật này.
Dù Nvidia vẫn duy trì ưu thế trong việc triển khai mô hình AI, các đối thủ như AMD cũng không ngừng nỗ lực để phát triển các sản phẩm cạnh tranh. Dự kiến, vào năm tới, AMD sẽ ra mắt một máy chủ AI tương tự, tích hợp nhiều chip mạnh mẽ nhằm cạnh tranh trực tiếp với các máy chủ Nvidia trong lĩnh vực inference (xử lý và triển khai mô hình).
