Mô hình AI DeepSeek-V3.2-Exp được giới thiệu, tối ưu hóa từ đầu cho chip Huawei, Cambricon và Hygon, mở ra một bước tiến quan trọng trong tham vọng tự chủ AI của Trung Quốc, nhằm thay thế sự phụ thuộc vào Nvidia CUDA.
Sự kiện này đánh dấu cột mốc quan trọng trong cuộc đua AI, khi DeepSeek công bố mô hình ngôn ngữ lớn DeepSeek-V3.2-Exp, được tối ưu cho các chip từ Huawei, Cambricon và Hygon để thay thế Nvidia CUDA.
Đảm bảo hỗ trợ chip nội địa và CANN ngay từ khi ra mắt
Vào ngày 29/9, DeepSeek đã chính thức giới thiệu mô hình AI DeepSeek-V3.2-Exp trên Hugging Face cùng báo cáo kỹ thuật chi tiết. Mô hình này đặc biệt vì được tối ưu hóa ngay từ đầu cho phần cứng Ascend của Huawei và nền tảng CANN, thay vì phụ thuộc hoàn toàn vào CUDA của Nvidia như trước đây.
DeepSeek cho biết đây là một bước đi quan trọng trong quá trình phát triển kiến trúc AI thế hệ mới, nhằm giảm chi phí xử lý ngữ cảnh dài thông qua cơ chế sparse attention, giúp tiết kiệm bộ nhớ mà vẫn duy trì chất lượng đầu ra.

Phiên bản mới nhất của DeepSeek được tối ưu hóa ngay khi ra mắt cho dòng chip Ascend của Huawei
Hỗ trợ mạnh mẽ từ các nhà sản xuất chip Trung Quốc
Ngay sau khi công bố, đội ngũ Huawei Ascend cùng cộng đồng vLLM-Ascend đã tích hợp DeepSeek-V3.2-Exp vào hệ thống và chia sẻ hướng dẫn cài đặt, triển khai cho NPU Ascend. Cambricon cũng phát hành bản cập nhật tương thích, khẳng định sự kết hợp giữa engine suy luận của hãng và cơ chế sparse attention giúp giảm chi phí xử lý chuỗi dài.
Hygon thông báo rằng bộ tăng tốc DCU của họ đã sẵn sàng cho việc “triển khai ngay lập tức” nhờ vào bộ công cụ DTK.
Mở rộng hệ sinh thái AI độc lập khỏi Nvidia
Bên cạnh Huawei, Cambricon và Hygon, DeepSeek cũng xác nhận khả năng chạy mô hình trên nhiều backend thông qua SGLang, đồng thời vẫn duy trì khả năng triển khai trên GPU Nvidia nhờ hỗ trợ TileLang và CUDA kernels. Điều này cho phép các nhà nghiên cứu triển khai linh hoạt trên cả nền tảng nội địa và quốc tế với sự thay đổi tối thiểu.

DeepSeek đang nỗ lực phát triển để giảm thiểu sự phụ thuộc vào Nvidia
Đánh dấu tham vọng tự chủ AI của Trung Quốc
Sự kiện DeepSeek-V3.2-Exp nhận được sự hỗ trợ nhanh chóng từ nhiều hãng chip cho thấy rằng hệ sinh thái AI Trung Quốc đang chuẩn bị sẵn sàng cho một tương lai không còn phụ thuộc vào Nvidia.
Mặc dù CUDA vẫn là chuẩn mực toàn cầu trong huấn luyện và suy luận AI, nhưng việc DeepSeek và các hãng chip nội địa tối ưu mô hình ngay từ khi ra mắt chứng tỏ quyết tâm của họ trong việc biến nền tảng trong nước trở thành lựa chọn hàng đầu, thay vì chỉ “theo đuôi” sau này.
