Chip GPU mạnh nhất từ Nvidia, GA100, đã được giới thiệu vào hôm thứ 5 tuần này. Dựa trên kiến trúc Ampere 7nm, anh em game thủ có thể trải nghiệm card đồ họa mới sớm nhất vào tháng 9 năm nay. Trong khi đó, GA100 được tạo ra đặc biệt cho thị trường HPC (High Performance Computing), như nghiên cứu khoa học, AI, Deep Neural Networking và AI Inferencing.
GA100 GPU được tích hợp trong các bo mạch xử lý Tesla A100 của Nvidia, được sử dụng trong các hệ thống xử lý hiệu năng cực cao như DGX A100 và HGX A100. Mặc dù sản xuất trên tiến trình 7nm, GA100 với diện tích chip xử lý lớn và số lượng transistor đáng kinh ngạc đã chứng minh sức mạnh của mình. Với mật độ transistor cao nhất, GA100 đang làm nên một con quái vật trong ngành công nghiệp GPU.
Đặc điểm kỹ thuật của GA100 thực sự ấn tượng:Khi tích hợp vào module Tesla A100, GA100 có một số điều chỉnh nhỏ:
7 GPCs, 7 hoặc 8 TPCs/GPC, 2 SMs/TPC, tối đa 16 SMs/GPC, 108 SMs
64 FP32 CUDA Cores/SM, 6912 FP32 CUDA Cores trên mỗi GPU
4 Tensor Cores thế hệ 4/SM, 432 Tensor Cores thế hệ 3 trên mỗi GPU
5 HBM2 stacks, 10 bộ điều khiển bộ nhớ 512-bit

GPU Ampere được phát triển dựa trên 5 tiến bộ mới của đội xanh:
- Kiến trúc Ampere của Nvidia, dựa trên quy trình 7nm của TSMC

GA100 có giao diện bus 6144-bit, hỗ trợ tối đa 48GB VRAM HBM2e trên 6 stack xung quanh GPU. Mỗi die VRAM trên stack có dung lượng 2GB, tổng cộng tạo ra băng thông lên đến 1.6 Tbps. Nvidia cũng có thể tung ra GPU A100 với 6 hoặc 8 stack VRAM mỗi stack để nâng tổng bộ nhớ lên đến 72 hoặc 96GB.
Về phần game thủ thì sao?
Hiện tại, chúng ta phải đợi đến tháng 9 mới có thể chiêm ngưỡng sức mạnh của Ampere qua các sản phẩm dành cho game thủ. Theo những tin đồn, RTX 3080 Ti sẽ thay thế RTX 2080 Ti, RTX 3080 sẽ làm mưa làm gió ở độ phân giải 4K. GA102 sẽ có 5.376 CUDA core, xung nhịp lên đến 2.2 GHz với công nghệ 7nm, và thậm chí khi giảm hiệu năng, tốc độ xử lý vẫn đạt được 21 TFLOPs (cao hơn cả Xbox Series X với 12 TFLOPs). Chip GPU nhỏ hơn có thể đạt được xung nhịp 2.5 GHz. Tất cả sẽ sử dụng bộ nhớ GDDR6, tốc độ 18 Gbps, tạo ra băng thông 863 GB/s, cao hơn RTX 2080 Ti 40% với memory bus 384-bit. Về hiệu năng chơi game, GA102 sẽ vượt trội hơn RTX 2080 Ti (ở độ phân giải 4K) từ 40 đến 70%, phụ thuộc vào việc các trò chơi được tối ưu hoá như thế nào.

Ngoài ra, có thể DLSS 3.0 cũng sẽ được giới thiệu, phối hợp cùng Tensor Core thế hệ mới trên GPU Ampere tạo ra hiệu suất chơi game đáng kinh ngạc, nhờ Tensor Core xử lý AI để bổ sung chi tiết đồ họa khi chơi game với DLSS. Chỉ cần render ở độ phân giải 1080p là đã upscale lên được 4K. Hiện nay, DLSS 2.0 đã gây ấn tượng mạnh trong Control và Mech Warrior 5, khi chơi ở độ phân giải 2K max setting nhưng chỉ render game ở độ phân giải 940p mà vẫn giữ được độ nét, như anh em có thể thấy trong tấm screenshot ở trên.
Theo WCCFTech, TechPowerUp
