Nếu Huawei thực sự là chìa khóa giúp DeepSeek có được mức giá "không tưởng" này, thì đây chắc chắn sẽ là một thảm họa đối với giới công nghệ Mỹ.
DeepSeek, một công ty khởi nghiệp AI đến từ Trung Quốc, đã làm chấn động ngành công nghệ toàn cầu khi ra mắt mô hình ngôn ngữ lớn (LLM) R1, khiến thị trường chứng khoán Mỹ mất tới 2 nghìn tỷ USD vì tâm lý lo ngại của các nhà đầu tư. Nhưng có vẻ như cơn ác mộng “AI giá rẻ” của DeepSeek đối với công nghệ Mỹ vẫn chưa dừng lại.
Ngoài việc tối ưu hóa phần mềm để đạt hiệu suất cao trong huấn luyện và phát triển mô hình AI, DeepSeek còn phát hiện một đột phá về phần cứng, giúp vận hành mô hình AI của mình với mức giá không tưởng so với các đối thủ Mỹ – đó là sử dụng chip máy chủ của Huawei.

Theo thông tin từ @dorialexander trên mạng xã hội X, DeepSeek R1 đang sử dụng chip Ascend 910C của Huawei để thực hiện các tác vụ suy luận (inference), mặc dù vẫn sử dụng GPU NVIDIA H800 cho quá trình huấn luyện. Ascend 910C được xem là đối thủ trực tiếp của bộ tăng tốc AI Hopper H100 của NVIDIA. Mặc dù các thông số kỹ thuật của chip này chưa được tiết lộ, nhưng Huawei dự định sản xuất hàng loạt vào quý 1/2025, thu hút sự quan tâm của các ông lớn AI như ByteDance và Tencent.
Đây là một bước đi chiến lược quan trọng trong bối cảnh Mỹ đang siết chặt xuất khẩu chip AI cao cấp sang Trung Quốc. Ascend 910C là đối thủ mạnh của NVIDIA H100, với lợi thế về giá và dự kiến sẽ sản xuất hàng loạt từ quý 1/2025.
Việc kết hợp phần cứng sản xuất trong nước và công nghệ tối ưu giúp DeepSeek R1 giảm thiểu chi phí vận hành đáng kể. Trong khi OpenAI yêu cầu $15 cho mỗi triệu token đầu vào, DeepSeek chỉ cần $0.55, một mức giá chênh lệch đáng kể mà các đối thủ phương Tây khó có thể so sánh. Hơn nữa, mô hình này hoàn toàn miễn phí và không giới hạn người dùng, là yếu tố quan trọng giúp chatbot của DeepSeek vượt qua và trở thành ứng dụng được tải nhiều nhất tại Mỹ chỉ sau vài tuần ra mắt.

Các sản phẩm AI của Huawei đang trở thành lựa chọn thay thế phổ biến cho phần cứng của NVIDIA tại thị trường Trung Quốc. Chúng đã chiếm lĩnh thị phần đáng kể và dự kiến sẽ ngày càng phổ biến trong tương lai. Việc sử dụng chip Huawei cho các tác vụ suy luận là một chiến lược thông minh, bởi chúng không chỉ có sẵn số lượng lớn cho các công ty nội địa mà còn có giá cạnh tranh hơn các sản phẩm "cắt giảm" của NVIDIA, thậm chí còn rẻ hơn các bộ tăng tốc không hợp pháp.
Hiện nay, thông tin về nguồn lực tính toán mà DeepSeek sử dụng cho mô hình R1 vẫn chưa rõ ràng và có nhiều sự hiểu lầm từ phía truyền thông. Trước hết, con số "5 triệu USD" không phải là tổng chi phí huấn luyện mà chỉ là chi phí vận hành mô hình cuối cùng. Thứ hai, có nguồn tin cho rằng DeepSeek đã có quyền truy cập vào hơn 50.000 GPU H100 của NVIDIA, điều này ngụ ý công ty vẫn cần nguồn lực tính toán như những mô hình AI khác.

Dù vậy, việc sử dụng chip Ascend 910C của Huawei cho tác vụ inference vẫn là một bước đi đáng chú ý. DeepSeek R1 tận dụng được lợi thế về giá cả và sự sẵn có của chip sản xuất trong nước, trong bối cảnh trước đó công ty phải phụ thuộc vào phần cứng nước ngoài đắt đỏ và khan hiếm do lệnh cấm vận. Huawei đang được cho là phát triển thế hệ chip AI Ascend tiếp theo, nhằm cạnh tranh với Blackwell AI của NVIDIA, điều này sẽ làm nóng cuộc đua công nghệ toàn cầu.
Sự ra đời của R1 là một cột mốc quan trọng trong ngành AI, khi một mô hình mã nguồn mở, hiệu suất cao nhưng chi phí lại cực kỳ thấp có thể cạnh tranh công bằng với các sản phẩm đắt đỏ từ Mỹ. Nó chứng tỏ rằng Trung Quốc đã âm thầm phát triển khả năng nội địa để vượt qua rào cản từ cuộc chiến chip và các lệnh kiểm soát xuất khẩu của Mỹ. Trong khi phương Tây vẫn loay hoay với mô hình "tiền tài trời cho", DeepSeek đã đưa ra một mô hình phá vỡ trật tự cũ, biến giấc mơ AI tầm tiền thành hiện thực. Có lẽ ngai vàng trong ngành trí tuệ nhân tạo sẽ không còn là sân chơi riêng của các ông lớn phương Tây.
