Tại sự kiện GTC 2022 đang diễn ra, Nvidia chính thức giới thiệu kiến trúc Hopper dành cho doanh nghiệp, máy chủ và hệ thống siêu máy tính chuyên nghiệp. Trong số những sản phẩm hàng đầu của kiến trúc xử lý này là CPU mang tên Grace, một cụm chip CPU khổng lồ với 144 nhân xử lý và 600GB RAM, cùng với GPU GH100 dành cho trung tâm dữ liệu, tích hợp 80 tỷ transistor, băng thông bộ nhớ HBM3 3TB/s và hiệu suất xử lý gần 4000 teraflops.Hopper GH100Kết Hợp Công Nghệ Sản Xuất Chip 4nm của TSMC và Bộ Nhớ HBM3, GH100 của Nvidia là Chip GPU Mạnh Mẽ Phục Vụ Các Nhiệm Vụ Cao Cấp về Trí Tuệ Nhân Tạo, Machine Learning, Deep Neural Network và Các Tác Vụ Yêu Cầu Hiệu Năng Cao Khác.
Các Đổi Mới Cơ Bản trong Công Nghệ Chip Xử Lý Hopper Bao Gồm:Nhân Tensor Core Thế Hệ 4 Mang Lại Hiệu Năng Gấp 6 Lần So Với Thế Hệ GPU A100 Kiến Trúc Ampere. Trên Mỗi SM (Stream Microprocessor), Hiệu Năng Tính Toán Matrix Multiply Accumulate của GH100 Cao Gấp Đôi So Với GA100 Trên Cùng Một Dạng Dữ Liệu.Tập Lệnh DPX Mới, Tăng Tốc Dynamic Programming Nhanh Gấp 7 Lần So Với GA100.Hệ Thống Bộ Nhớ HBM3 Tạo Ra Băng Thông Bộ Nhớ Gấp Đôi So Với Thế Hệ GPU Trước Đó. GPU H100 SXM5 Có Băng Thông Bộ Nhớ Lên Đến 3TB/s.Bộ Nhớ Đệm L2 Dung Lượng 50MB Cho Phép Trao Đổi Những Gói Dữ Liệu Lớn Giữa Các SM, Giảm Thời Gian GPU Phải Tương Tác Với VRAM.Cầu Nối NVLink Thế Hệ Thứ 4, Tăng Băng Thông Kết Nối Lên Gấp 3 Lần, Kết Nối Nhiều GPU Với Nhau Tạo Ra Băng Thông Bộ Nhớ 900 GB/s.Kết Nối PCIe 5.0 Tạo Ra Băng Thông Gấp Đôi (128GB/s) So Với PCIe 4.0, Qua Đó Cho Phép Những GPU H100 Làm Việc Hiệu Quả Nhất Với Những CPU Máy Chủ Mạnh Nhất Hiện Nay Hoặc Những Chip Data Processing Unit.
GH100 Được Tích Hợp Trong Sản Phẩm Đầu Bảng Của Nvidia, Một Mẫu Card Add-in Mang Tên H100 SXM5, Kết Nối Với Máy Chủ Hoặc Siêu Máy Tính Thông Qua PCIe 5.0. Mẫu GPU Này Trang Bị 8 Cụm Xử Lý GPC (Graphics Processing Cluster), Mỗi GPC Có 9 TPC (Texture Processing Cluster), và Mỗi TPC Trang Bị 2 Stream Microprocessor. Tổng Cộng Trên Bề Mặt Con Chip Là 18432 Nhân CUDA, Kết Nối Với Hệ Thống Bộ Nhớ 80GB HBM3, Quản Lý Bằng 10 Memory Controller 512-bit.
Nvidia Cho Biết Với Cấu Hình Như Thế Này, GH100 Trên Card SXM5 Tạo Ra Sức Mạnh Xử Lý 4000 Teraflops FP8, 2000 Teraflops FP16, 1000 Teraflops FP32 và 60 Teraflops FP64, Tức Là Nhanh Hơn Thế Hệ GA100 Trước Đó 3,3 Lần, Nhanh Hơn AMD Instinct MI250X Vừa Ra Mắt 28% Xét Đến Hiệu Năng Xử Lý FP64, và Nhanh Hơn 5,2 Lần Xét Đến Hiệu Năng FP16.
Con Chip GPU Cực Mạnh Này Sẽ Được Tích Hợp Trong Những Sản Phẩm Khác Như DGX H100, Kết Hợp 8 GPU H100, VRAM Tối Đa 640GB Để Biến Thành Một Nền Tảng Siêu Máy Tính Sức Mạnh Xử Lý Tối Đa 32 Petaflop.
Hoặc Có Thể Là Con Chip Này Sẽ Được Sử Dụng Trên Card Tăng Tốc H100 PCIe, Tuy Nhiên Phiên Bản GPU Này Chỉ Có 114 Stream Microprocessor Thay Vì Đủ 144 SM Như Phiên Bản Cao Cấp. Tuy Vậy, Vẫn Đủ Để Mẫu 'Card Đồ Họa' Này Tạo Ra Hiệu Suất Xử Lý Lên Đến 800 Terflops FP32, Với TDP Chỉ Ở Ngưỡng 350W, Phục Vụ Cho Các Nghiên Cứu Khoa Học, Y Học, Biến Đổi Khí Hậu, Vv...
Grace CPUNếu Như Những Năm Trước, Những Giải Pháp Siêu Máy Tính Mà Nvidia Bán Cho Khách Hàng Đều Phải Nhờ Tới Sự Trợ Giúp Của Những CPU Máy Chủ Siêu Mạnh Như Xeon Scalable Hay AMD Epyc, Thì Giờ Họ Đã Có CPU Riêng, Dựa Trên Kiến Trúc ARM Và Đặt Tên Là Grace, Kết Hợp Với GPU Hopper Tạo Ra Tên Của Nhà Nữ Khoa Học Gia Người Mỹ.
Grace là một 'CPU siêu mạnh' với 144 nhân ARM v9, tổng băng thông bộ nhớ 1TB/s qua hệ thống chip RAM LPDDR5x, hỗ trợ ECC, phục vụ cho nhu cầu xử lý máy chủ đám mây hoặc máy tính hiệu năng cao. Nvidia quảng cáo rằng con chip này có hiệu năng tiêu thụ điện gấp đôi so với các giải pháp hàng đầu của AMD và Intel hiện tại, cụ thể là con chip Epyc 7773X 64 nhân mới được ra mắt hoặc Xeon Platinum 8380 40 nhân.
Khi kết hợp với GPU Hopper, CPU Grace sẽ tạo ra hiệu năng xử lý nhanh hơn gấp 10 lần so với các hệ thống siêu máy tính DGX hiện tại của Nvidia, sử dụng CPU x86. Đó chính xác là những gì họ đã thực hiện, kết hợp CPU và GPU để tạo ra một bo mạch được gọi là Grace Hopper superchip, phục vụ nhu cầu xử lý trí tuệ nhân tạo, máy chủ đám mây hoặc HPC quy mô lớn. Bo mạch này trang bị 600GB bộ nhớ cho GPU, cầu nối NVLink 900 GB/s, nhanh hơn chuẩn PCIe 5.0 gấp 7 lần, và chạy các phần mềm tùy chỉnh của Nvidia mang tên Nvidia Software Stack.