
Theo tiêu chuẩn, siêu chip Grace Hopper GH200 thường chỉ được sử dụng trong các máy chủ và trung tâm dữ liệu chuyên biệt để vận hành hoặc huấn luyện các mô hình Trí Tuệ Nhân Tạo, từ mô hình ngôn ngữ cho đến các giải pháp thương mại dưới hình thức chatbot như ChatGPT. Thậm chí, GH200 cũng không rẻ. Chứng minh cho điều này là gần đây, cửa hàng GPTshop đã bắt đầu bán một hệ thống máy tính dạng thùng workstation cho cá nhân hoặc doanh nghiệp, tích hợp GH200 bên trong, với giá 41.500 USD cho phiên bản 576GB RAM, và 48.500 USD cho phiên bản trang bị 624GB RAM.
GH200 là một chip xử lý kết hợp giữa “siêu CPU” Grace và GPU Hopper. Trên một con chip Grace CPU là 72 nhân CPU Neoverse V2, hoặc sẽ được trang bị trên Grace Hopper GH200, hoặc trang bị 2 CPU, được gọi là Super Grace, có 144 nhân CPU kiến trúc ARM, vận hành kết hợp với bộ nhớ LPDDR5x.
Theo Nvidia, đây là hệ thống đầu tiên được trang bị bộ nhớ HBM3e công nghệ tiên tiến nhất, cải thiện cả dung lượng và băng thông bộ nhớ. Các hệ thống sử dụng GPU GH200 hiện nay có thể đạt đến tối đa 282GB bộ nhớ để thực hiện xử lý và huấn luyện machine learning.
HBM3e có tốc độ nhanh hơn 50% so với HBM3 hiện tại, mỗi hệ thống siêu máy tính của Nvidia có thể đạt ngưỡng băng thông bộ nhớ 10TB/s, và mỗi GPU đạt băng thông 5 GB/s. Trong tương lai, Nvidia dự kiến sẽ áp dụng HBM3e cho các GPU phục vụ doanh nghiệp nói chung và Trí Tuệ Nhân Tạo nói riêng, từ CPU Grace, GPU Hopper, GPU Ada Lovelace và DPU BlueField.
Quan sát cấu trúc bên trong, có thể dễ dàng nhận ra cỗ máy tính với Nvidia GH200, cả CPU lẫn GPU đều được thiết kế và sản xuất bởi Nvidia, tạo ra một cụm máy chủ rất giống nhau, nhưng được đặt trong thùng máy ATX truyền thống dành cho máy tính để bàn, ở đây là InWin Dubili.



Đối với dàn máy tính siêu đẳng này, bộ nhớ RAM lên đến 576 GB được chia thành 480GB LPDDR5x cho hệ thống và 96GB HBM3 cho GPU. Phiên bản khác với tổng cộng 624GB RAM cũng có 480GB LPDDR5x cho hệ thống, nhưng GPU được nâng cấp lên 144GB RAM HBM3. Cả hai phiên bản đều được trang bị cầu nối NVLINK-C2C, băng thông 900 GB/s, và có thể điều chỉnh TDP từ 450 đến 1000W.
Để hoạt động, thùng máy này được trang bị hai bộ nguồn 2400W, 2 khe PCIe Gen4 trên bo mạch chủ, 2 khe PCIe Gen4 2.5', hỗ trợ card add in FHFL PCIe Gen 5x16 để tối ưu bộ nhớ lưu trữ. Trọng lượng của thùng máy này là khoảng 30kg.
Thay vì sử dụng các giải pháp làm mát chuyên nghiệp cho máy chủ hoặc trung tâm dữ liệu, máy tính này sử dụng một chiếc quạt tản nhiệt Noctua NF-A15 PWM để làm mát cho chip GH200. Ngoài ra, còn có 8 quạt Noctua khác trên thùng máy.
Theo bài viết trên trang WCCFTech