Các sản phẩm này được phát triển nhằm tối ưu hóa hiệu suất AI, đặc biệt trong lĩnh vực suy luận (inference) và huấn luyện (training), khẳng định vị thế dẫn đầu của Nvidia trong ngành công nghệ toàn cầu.
Tại Hội nghị Công nghệ GPU (GTC) 2025, CEO Nvidia Jensen Huang đã trình làng dòng GPU tăng tốc AI tiên tiến, bao gồm Blackwell Ultra B300, Vera Rubin và Rubin Ultra. Những sản phẩm này được thiết kế để nâng cao hiệu suất AI, đặc biệt trong các tác vụ suy luận (inference) và đào tạo (training), củng cố vị thế của Nvidia trong cuộc đua công nghệ thế giới.

Blackwell Ultra B300, dự kiến ra mắt vào nửa cuối năm 2025, là phiên bản nâng cấp vượt trội từ Blackwell GB200. GPU này tăng dung lượng bộ nhớ từ 192GB lên 288GB HBM3e và cải thiện 50% hiệu suất tính toán FP4 tensor dày đặc. Điều này giúp hỗ trợ các mô hình AI lớn hơn, đồng thời tăng hiệu quả suy luận cho các nền tảng như DeepSeek R1. Trong cấu hình giá đỡ NVL72 đầy đủ, Blackwell Ultra đạt 1,1 exaflop tính toán suy luận FP4 – một bước tiến đáng kể so với phiên bản B200 hiện tại.

Không chỉ dừng lại ở GPU đơn lẻ, Blackwell Ultra B300 còn đi kèm với các giải pháp như giá đỡ máy chủ B300 NVL16, trạm DGX GB300 và hệ thống giá đỡ GB300 NV72L. Khi kết hợp tám giá NV72L, Blackwell Ultra DGX SuperPOD được tạo ra với 288 CPU Grace, 576 GPU Blackwell Ultra, 300TB bộ nhớ HBM3e và sức mạnh tính toán FP4 lên đến 11,5 exaflop. Nvidia gọi đây là “nhà máy AI” – những siêu máy tính có khả năng kết nối để đáp ứng nhu cầu tính toán khổng lồ.

Được trình làng lần đầu tại Computex 2024, Vera Rubin dự kiến ra mắt vào nửa cuối năm 2026, mang đến những cải tiến đột phá cho cả quá trình đào tạo và suy luận AI. GPU này tích hợp hai chip trên một đế, đạt hiệu suất suy luận FP4 50 petaflop mỗi chip, cùng với hàng chục terabyte bộ nhớ. Đi kèm là CPU Vera do Nvidia tự thiết kế, với 88 lõi Arm tùy chỉnh và 176 luồng. Trong cấu hình giá đỡ NVL144, Vera Rubin cung cấp 3,6 exaflop tính toán suy luận FP4, hứa hẹn thay đổi hoàn toàn khả năng xử lý AI.

Nvidia cũng tiết lộ kiến trúc GPU thế hệ tiếp theo mang tên “Feynman”, dự kiến ra mắt vào năm 2028 cùng với CPU Vera. Mặc dù chưa có nhiều thông tin chi tiết, Feynman được kỳ vọng sẽ tiếp tục nâng cao khả năng tính toán AI, duy trì đà phát triển mạnh mẽ của Nvidia.
Trong bài phát biểu của mình, Jensen Huang mô tả các trung tâm dữ liệu tương lai như những “nhà máy AI”, nơi sản xuất mã thông báo (token) cho các mô hình AI. Ông nhấn mạnh tầm quan trọng của “AI vật lý” trong việc cung cấp năng lượng cho robot hình người, sử dụng phần mềm Nvidia để huấn luyện AI trong môi trường ảo trước khi triển khai thực tế. Chiến lược này không chỉ thể hiện tham vọng công nghệ mà còn nhằm xoa dịu các nhà đầu tư sau những biến động thị trường gần đây, nhờ vào thành công của dòng chip Blackwell.
