Cộng đồng công nghệ từng đặt nhiều kỳ vọng vào phiên bản AI mới nhất của DeepSeek, coi đây là bước nhảy vọt quan trọng trong ngành trí tuệ nhân tạo.
DeepSeek - startup AI Trung Quốc gây tiếng vang với mẫu R1 đầu năm - hiện đang trì hoãn phát triển thế hệ kế tiếp R2 do khủng hoảng thiếu chip H20 từ NVIDIA. Nguồn tin từ The Information cho biết trong khi vấn đề chưa được giải quyết, DeepSeek vẫn im lặng về thời điểm chính thức ra mắt R2.
Quá trình xây dựng R1 sử dụng hệ thống 50.000 GPU Hopper gồm ba loại: 30.000 H20, 10.000 H800 và 10.000 H100 do High-Flyer Capital Management tài trợ. Tuy nhiên, tình trạng pre-train hoàn chỉnh của R2 hiện vẫn là ẩn số.
Theo nguồn tin nội bộ được The Information dẫn lại, đội ngũ kỹ sư DeepSeek đã làm việc không ngừng trên R2, nhưng CEO Liang Wenfeng vẫn chưa đạt được mức độ hài lòng cần thiết về chất lượng. Các nâng cấp hiệu năng vẫn đang được thử nghiệm kín trước khi đưa vào ứng dụng thực tế.

Tình trạng khan hiếm GPU AI H20 từ NVIDIA được xác định là rào cản chính khiến DeepSeek phải lùi ngày ra mắt thế hệ AI mới
Mô hình R1 nhanh chóng được triển khai rộng rãi bởi đa dạng người dùng từ startup, tập đoàn đến các tổ chức chính phủ, phần lớn chạy trên nền tảng H20 của NVIDIA. Hiện tại, việc hạn chế xuất khẩu H20 không chỉ ảnh hưởng đến hoạt động của R1 mà còn gây trở ngại lớn cho quá trình chuẩn bị ra mắt R2.
Theo nguồn tin từ nhân viên các công ty cloud Trung Quốc được The Information dẫn lời, nếu mô hình R2 sắp tới của DeepSeek thực sự vượt trội so với các giải pháp mã nguồn mở hiện tại, nhu cầu sử dụng dự kiến sẽ bùng nổ vượt xa khả năng đáp ứng của hạ tầng điện toán đám mây trong nước. Đáng chú ý, phần lớn hệ thống chạy R1 hiện nay đều phụ thuộc vào chip H20 của NVIDIA - mặt hàng đang thiếu hụt trầm trọng.
Từ giữa tháng 4, chính phủ Mỹ đã siết chặt lệnh cấm bán chip H20 của NVIDIA phục vụ huấn luyện và vận hành AI. Dù là phiên bản bị giảm hiệu năng đáng kể so với H100, nhưng nhờ sự phổ biến của hệ sinh thái CUDA, H20 vẫn được ưa chuộng tại thị trường Trung Quốc, giúp NVIDIA thu về hàng tỷ USD mỗi quý từ sản phẩm này.

Báo cáo cho thấy phần mềm AI của DeepSeek được tối ưu hóa đặc biệt cho kiến trúc NVIDIA, khiến họ trở nên cực kỳ nhạy cảm trước các thay đổi chính sách từ Mỹ. Dù tự hào phát triển mô hình với tài nguyên ít hơn nhiều so với OpenAI, lệnh cấm xuất khẩu gần đây đã phơi bày điểm yếu chiến lược: giới AI hàng đầu Trung Quốc vẫn lệ thuộc nặng nề vào phần cứng Mỹ.
Khủng hoảng thiếu chip H20 không chỉ ảnh hưởng trực tiếp đến hoạt động của R1 mà còn tạo ra rào cản lớn cho quá trình phát triển và triển khai R2. Tình hình này phản ánh mức độ phụ thuộc đáng báo động của ngành AI Trung Quốc vào công nghệ phần cứng Mỹ, đặc biệt là các sản phẩm đến từ NVIDIA.
Việc trì hoãn R2 cho thấy tác động thực tế của các biện pháp trừng phạt mà Mỹ áp đặt nhằm kìm hãm sự phát triển AI của Trung Quốc. Đối với DeepSeek - từng được ca ngợi vì khả năng tạo ra AI chất lượng cao với chi phí thấp - cuộc khủng hoảng nguồn cung linh kiện đang đặt ra những thách thức chưa từng có cho lộ trình phát triển tương lai.
Tính đến thời điểm hiện tại, DeepSeek vẫn chưa thể công bố lộ trình chính thức cho R2. Thời gian trì hoãn có thể kéo dài tùy thuộc vào việc các lệnh cấm vận có được dỡ bỏ hay không, cũng như khả năng tìm được giải pháp thay thế hiệu quả của công ty.
Nguyễn Hải (Theo tomshardware)
