Nghiên cứu này không chỉ giúp Trung Quốc giảm bớt sự phụ thuộc vào chip và phần mềm của Mỹ, mà còn mở ra cơ hội để cạnh tranh vị thế dẫn đầu trong ngành công nghệ.
Các nhà khoa học Trung Quốc vừa công bố kết quả cho thấy hệ thống siêu máy tính sử dụng GPU nội địa có khả năng đạt hiệu suất tính toán gấp gần 10 lần so với các siêu máy tính hàng đầu của Mỹ dựa trên chip NVIDIA. Theo báo cáo trên Tạp chí Kỹ thuật Thủy lợi Trung Quốc, đây là một bước tiến quan trọng trong việc vượt qua các hạn chế công nghệ khi Mỹ liên tục siết chặt các lệnh trừng phạt.
Các mô phỏng khoa học và kỹ thuật quy mô lớn, như dự báo lũ lụt hay tính toán thủy văn, thường yêu cầu nguồn tài nguyên siêu máy tính khổng lồ. Đối với Trung Quốc, vấn đề này càng trở nên phức tạp do sự phụ thuộc vào GPU tiên tiến từ nước ngoài và giới hạn bởi hệ sinh thái phần mềm CUDA của NVIDIA.
Nhóm nghiên cứu do giáo sư Nan Tongchao đứng đầu, thuộc Phòng Thí nghiệm Trọng điểm Quốc gia về Thủy văn và Kỹ thuật Thủy lợi (Đại học Hohai, Nam Kinh), đã phát triển một mô hình tính toán “đa node, đa GPU” hoàn toàn dựa trên CPU và GPU sản xuất trong nước.

Nghiên cứu này sẽ giúp giới khoa học Trung Quốc giảm bớt sự phụ thuộc vào phần mềm và phần cứng nước ngoài
Giải pháp này được thiết kế để kết hợp nhiều GPU trong một nút tính toán, nhằm khắc phục hạn chế về phần cứng và tối ưu hóa việc trao đổi dữ liệu giữa các nút thông qua kỹ thuật phần mềm do nhóm tự phát triển.
Trước đây, phòng thí nghiệm Oak Ridge National Laboratory (Mỹ) đã triển khai mô hình TRITON để dự báo lũ lụt, hoạt động trên siêu máy tính Summit với GPU NVIDIA. Tuy nhiên, dù được trang bị 64 node tính toán, tốc độ của TRITON chỉ tăng khoảng 6 lần so với chạy đơn lẻ.

Siêu máy tính TRITON sử dụng GPU NVIDIA của Mỹ
Trong khi đó, giáo sư Nan đã đề xuất một kiến trúc mới cho phép kết hợp nhiều GPU vào một node, nhằm bù đắp sự thiếu hụt về hiệu năng của GPU và CPU Trung Quốc so với các sản phẩm nước ngoài. Ngoài ra, ông cũng cải thiện khả năng trao đổi dữ liệu giữa các node ở cấp độ phần mềm để giảm tình trạng quá nhiệt khi chúng giao tiếp với nhau.
Toàn bộ cấu hình máy chủ của nhóm nghiên cứu sử dụng nền tảng x86 nội địa, trang bị CPU Hygon 7185 (32 lõi, 64 luồng, xung nhịp 2,5 GHz) và GPU trong nước với dung lượng bộ nhớ 128GB, băng thông mạng 200 Gb/s. Theo bài báo công bố, việc tích hợp nhiều GPU trong một nút kết hợp với giải pháp phần mềm giảm tải truyền thông liên nút chính là yếu tố then chốt giúp khai thác tối đa hiệu suất của phần cứng “made in China.”

CPU Hygon 7185 được sản xuất trong nước tại Trung Quốc
Nhờ đó, giải pháp mới của giáo sư Nan chỉ cần 7 node đã tăng tốc độ xử lý lên gấp 6 lần, đồng nghĩa với việc sử dụng số node ít hơn đến 89% so với TRITON của Mỹ. Ở quy mô lớn hơn, nhóm của ông sử dụng 200 node với 800 GPU để mô phỏng đập Chuangli (tỉnh Sơn Đông) trong vòng ba phút, đạt hiệu suất cao hơn 160 lần so với phiên bản gốc, vượt xa khả năng mà TRITON thể hiện.
Kết quả này không chỉ có ý nghĩa về mặt công nghệ, khi cho thấy Trung Quốc đang dần thu hẹp khoảng cách so với tiêu chuẩn nước ngoài trong lĩnh vực siêu máy tính, mà còn mở ra tiềm năng ứng dụng thực tế rất lớn.
Việc chạy các mô phỏng lũ lụt trong thời gian ngắn giúp cảnh báo và phản ứng hiệu quả hơn với tình trạng nước dâng cao hoặc kịch bản vỡ đê. Tương tự, công nghệ tính toán mô phỏng này cũng có thể được ứng dụng trong các nghiên cứu về thủy văn-khí tượng, tương tác giữa nước mặt và nước ngầm, hay quá trình bồi lắng phù sa.
Nhóm nghiên cứu đã công bố mã nguồn mở của hệ thống, tạo điều kiện cho cộng đồng khoa học quốc tế tiếp tục phát triển và kiểm chứng tính bền vững trong nhiều bối cảnh khác nhau. Dù vẫn còn những nghi ngại về việc liệu cải tiến phần mềm có đủ để theo kịp trình độ phần cứng cao cấp hay không, thành công ban đầu của GPU nội địa đã cho thấy tiềm năng đột phá của Trung Quốc trong việc giảm dần sự phụ thuộc vào công nghệ nước ngoài và khẳng định nỗ lực không ngừng trong tham vọng vươn lên dẫn đầu lĩnh vực siêu máy tính.
