Điều đáng chú ý là công ty sản xuất GPU này của Trung Quốc mới chỉ hoạt động được 5 năm.
Công ty Moore Threads của Trung Quốc cho biết họ đang đạt được tiến bộ đáng kể trong phát triển GPU AI của mình, với việc ra mắt GPU tăng tốc AI S4000 mới nhất, vượt trội hơn so với thế hệ trước.
Theo báo cáo của cnBeta, quá trình huấn luyện sử dụng cụm điện toán Intelligent Computing Cluster Kua'e Qianka với GPU S4000 đứng thứ ba về tốc độ trong bài kiểm tra trí tuệ nhân tạo, vượt trội hơn một số đối thủ bao gồm cả các cụm GPU AI của NVIDIA.
Kết quả đánh giá được thu thập từ một bài kiểm tra ổn định cho cụm điện toán Intelligent Computing Cluster Kua'e Qianka. Quá trình huấn luyện kéo dài tổng cộng 13,2 ngày và được cho là hoạt động hoàn hảo không gặp sự cố hay gián đoạn nào. Mô hình trí tuệ nhân tạo được sử dụng để đánh giá cụm máy tính mới là mô hình ngôn ngữ lớn MT-infini-3B.
Bảng xếp hạng cho thấy GPU Moore Threads đứng thứ ba về tốc độ huấn luyện mô hình ngôn ngữ lớn, vượt mặt cả các GPU của NVIDIA, tuy không rõ loại nào.
Cụm máy tính mới được đánh giá là một trong những cụm GPU AI hàng đầu với cùng quy mô (sử dụng số lượng GPU tương đương). Tuy nhiên, bảng xếp hạng cũng có nhiều chi tiết không hợp lý.
Ví dụ, GPU MTT S4000 được so sánh với các GPU NVIDIA không xác định – do đó chúng ta không biết đó là A100, H100 hay H200, nhưng có thể là A100. Các tác vụ cũng không giống nhau. Huấn luyện bằng MT-infini-3B có thể khác với Llama3-3B chẳng hạn. Nói cách khác, thông tin trong bảng đánh giá này vẫn còn nhiều chi tiết không hoàn toàn hợp lý.
Tuy nhiên, vẫn phải thừa nhận rằng việc huấn luyện LLM trên GPU Moore Threads vẫn là một bước tiến quan trọng trong quá trình nội địa hóa GPU của Trung Quốc. Cụm máy tính Kua'e Qianka ít nhất đã cho thấy GPU AI MTT S4000 có thể cạnh tranh với kiến trúc GPU A100 thế hệ trước của Nvidia.
GPU S4000 của Moore Threads
Nhận định này cũng được hỗ trợ bởi dữ liệu hiệu suất thô của S4000 – khi không chỉ vượt trội so với các GPU AI tiền nhiệm S3000 và S2000 của Moore Thread – mà còn so với các bộ gia tốc AI dựa trên kiến trúc Turing của NVIDIA. S4000 có thể không sánh kịp với bộ gia tốc AI A100 của Nvidia, nhưng có lẽ không cách xa nhiều so với dòng Ampere.
Đối với Moore Threads, hiệu suất của Kua'e Qianka là một chiến thắng lớn, bất kể là GPU Nvidia hay LLM nào được kiểm tra. Nó cho thấy Moore Threads có khả năng xây dựng GPU AI có thể thực hiện các công việc tương tự các đối thủ GPU AI từ NVIDIA, AMD và Intel. Có thể không bằng, nhưng đây là một bước quan trọng trên con đường đến các siêu máy tính và cụm AI mạnh mẽ hơn.
Đây là một thành tựu đáng nể đối với một nhà sản xuất GPU của Trung Quốc mới thành lập chưa đầy 5 năm. Nếu Moore Threads có thể tiếp tục đạt được các cải tiến đáng kể về hiệu suất giữa các thế hệ GPU, họ có thể có một bộ gia tốc GPU AI với hiệu suất tương đương với đối thủ Phương Tây trong vài năm tới. Tất nhiên đó chỉ là một điều 'NẾU' và với kinh nghiệm lịch sử, nhiều người thấy rằng việc phát triển GPU không phải luôn diễn ra theo kế hoạch.
Thành tích này còn đáng kể hơn trong bối cảnh chính phủ Mỹ đang tìm mọi cách hạn chế xuất khẩu các GPU AI cao cấp sang Trung Quốc. Điều này cũng là một nỗ lực hạn chế tiềm năng nghiên cứu và phát triển AI của quốc gia này. Do đó, mỗi bước tiến dù nhỏ về hiệu suất của các linh kiện này đều được xem như một bước tiến quan trọng cho khả năng tự chủ công nghệ cao của Trung Quốc.
Chúng tôi cũng rất háo hức chờ đợi xem liệu Moore Threads có thể mang lại hiệu suất AI tốt trong lĩnh vực game hay không. Đến nay, các GPU MTT vẫn không hoạt động tốt trong các bài kiểm tra game, một phần do các driver/tối ưu hóa chưa hoàn thiện. Trong khi AI đòi hỏi nhiều khả năng tính toán, nó hoàn toàn khác biệt so với xử lý đồ họa máy tính thời gian thực, do đó, kinh nghiệm trong lĩnh vực này không đồng nghĩa với khả năng tương tự trong lĩnh vực kia.