Nguyên nhân chính của cơn sốt này xuất phát từ nhu cầu sử dụng card đồ họa để vận hành các mô hình AI tiên tiến của DeepSeek.
Thị trường card đồ họa Nvidia RTX 5090 đang trở nên cực kỳ sôi động, đặc biệt là ở Trung Quốc, nhưng không phải vì các game thủ muốn cải thiện FPS trong game. Thay vào đó, sự bùng nổ này đến từ nhu cầu sử dụng GPU để chạy các mô hình AI hiện đại của DeepSeek, khi các doanh nghiệp nhận ra rằng GPU tiêu dùng của Nvidia có thể thay thế các bộ tăng tốc AI đắt đỏ với chi phí thấp hơn đáng kể.

Theo báo cáo từ The Information, các mô hình R1 đột phá của DeepSeek có thể hoạt động hiệu quả trên GPU thông thường, thay vì phải dựa vào các bộ tăng tốc AI chuyên dụng như H20 với giá thành cực cao. Điều này đã khiến nhu cầu về phiên bản RTX 5090D – được thiết kế riêng cho thị trường Trung Quốc – tăng đột biến, đẩy giá của card này trên chợ đen lên tới 5.000 USD (khoảng 125 triệu VND). Tuy nhiên, việc tìm mua được một chiếc với mức giá này vẫn là một thách thức lớn.

Không chỉ riêng Trung Quốc, RTX 5090 và 5090D trên toàn cầu cũng đang bị đẩy giá cao hơn nhiều so với mức MSRP ban đầu là 2.000 USD (khoảng 50 triệu VND). Trên eBay.com, nhiều người bán đang rao giá từ 5.000 đến 10.000 USD, phần lớn được vận chuyển từ Trung Quốc. Tại Mỹ, một số cá nhân cũng bán lại card với giá từ 2.500 đến 5.000 USD. Tình trạng khan hiếm hàng và nhu cầu cao khiến việc mua RTX 5090 hay bất kỳ sản phẩm nào thuộc dòng Blackwell trực tiếp từ nhà bán lẻ trở nên cực kỳ khó khăn, gợi nhớ đến thời kỳ đỉnh điểm của đại dịch và khủng hoảng tiền điện tử năm 2020-2021.

Mô hình R1 của DeepSeek, với 671 tỷ tham số, ban đầu được thiết kế cho các hệ thống hiệu suất cao. Tuy nhiên, công ty đã phát triển các phiên bản nhẹ hơn, phù hợp với phần cứng tiêu dùng. Ví dụ, Llama 8B với 8 tỷ tham số chỉ yêu cầu GPU có 21GB VRAM. Tháng trước, Nvidia và AMD đã có cuộc tranh cãi công khai về hiệu năng của card đồ họa tiêu dùng khi chạy các mô hình AI của DeepSeek. AMD tuyên bố 7900 XTX vượt trội hơn RTX 4090, nhưng Nvidia đã phản bác bằng các điểm chuẩn cho thấy RTX 4090 và RTX 5090 đều nhanh hơn khi thử nghiệm với Distill Qwen 7B, Llama 8B và Qwen 32B trên công cụ đo llama-bench.
Cơn sốt RTX 5090 không chỉ phản ánh sức hút của công nghệ AI mà còn cho thấy sự cạnh tranh khốc liệt giữa các gã khổng lồ trong ngành sản xuất phần cứng, khi nhu cầu về sức mạnh tính toán tiếp tục tăng cao.
