Trung Quốc vừa vận hành cụm điện toán AI phân tán lớn nhất thế giới. Hệ thống trải dài khoảng 2 km này có thể đạt tới 98% hiệu suất của một trung tâm dữ liệu đơn lẻ.
Khi các trung tâm điện toán được liên kết, toàn bộ hệ thống hoạt động gần như tương đương với một siêu máy tính duy nhất.
Hệ thống mang tên Future Network Test Facility (FNTF) và chính thức đi vào hoạt động từ ngày 3/12. Mạng lưới kết nối các trung tâm dữ liệu trải dài 2 km qua đường truyền quang tốc độ cao, cho phép vận hành như một siêu máy tính thống nhất.

Ông Liu Yunjie, thành viên Viện Công trình Trung Quốc và giám đốc dự án, nhấn mạnh rằng đường truyền dữ liệu chuyên dụng này mang tính cách mạng đối với các ứng dụng cần phản hồi thời gian thực cao như huấn luyện mô hình AI lớn, y tế từ xa và internet công nghiệp.
Ông chia sẻ: “Huấn luyện một mô hình lớn với hàng trăm tỷ tham số thường cần hơn 500.000 vòng lặp. Trên mạng định tuyến của chúng tôi, mỗi vòng lặp chỉ mất khoảng 16 giây. Nếu không có năng lực này, mỗi vòng lặp sẽ kéo dài hơn 20 giây, khiến toàn bộ chu trình huấn luyện có thể tốn thêm vài tháng”.
Ban lãnh đạo dự án cho biết mạng lưới đạt khoảng 98% hiệu suất so với một cụm trung tâm dữ liệu đồng bộ. Việc kết nối tài nguyên điện toán từ các khu vực xa nhau giúp rút ngắn thời gian huấn luyện, giảm chi phí và mở rộng khả năng tiếp cận công nghệ AI tiên tiến tại Trung Quốc.
Bước tiến này cũng đồng bộ với chiến lược xây dựng nền tảng điện toán quốc gia của Trung Quốc, bao gồm phát triển trung tâm dữ liệu ở các vùng dồi dào năng lượng và đầu tư vào công nghệ tiên tiến như chip quang tử và chip lượng tử. Dù có nhiều ưu thế, hiệu quả chuyển đổi lâu dài vẫn phụ thuộc vào khả năng duy trì hiệu suất, nhu cầu năng lượng và yếu tố an ninh.
Theo báo cáo, FNTF lần đầu được đề cập trong “Kế hoạch trung và dài hạn xây dựng hạ tầng khoa học và công nghệ quốc gia trọng điểm” của Trung Quốc năm 2013.
Hiện hệ thống phủ khắp 40 thành phố với tổng chiều dài đường truyền quang vượt 55.000 km, tương đương 1,5 vòng quanh xích đạo. Hệ thống hoạt động liên tục 24/7, hỗ trợ đồng thời 128 mạng không đồng nhất và chạy song song 4.096 thử nghiệm dịch vụ. SCMP cho biết mạng có năng lực truyền tải xác định, độ tin cậy cao và băng thông lớn.
Hệ thống còn phục vụ các mục tiêu chiến lược khác như nâng cao dịch vụ y tế nhờ chẩn đoán từ xa và cải thiện hiệu quả tự động hóa công nghiệp thông qua xử lý dữ liệu thời gian thực trên phạm vi rộng.
Tuy nhiên, vẫn tồn tại nhiều yếu tố chưa rõ ràng. Việc duy trì hiệu suất cao trên quãng đường dài đòi hỏi mạng phải cực kỳ ổn định, trong khi nhu cầu năng lượng cho các trung tâm dữ liệu quy mô lớn cũng rất đáng kể.
Theo IE
