Mặc dù không thể so sánh trong lĩnh vực đào tạo AI, chip này lại cho thấy tiềm năng lớn giúp Trung Quốc thoát khỏi sự phụ thuộc vào GPU của NVIDIA, nhất là khi kết hợp cùng những cải tiến phần mềm từ DeepSeek.
Bộ xử lý HiSilicon Ascend 910C của Huawei là phiên bản nâng cấp của Ascend 910, dòng chip AI ra mắt từ năm 2019. Trong bối cảnh các mô hình AI ngày càng trở nên lớn và phức tạp, hiệu suất của Ascend 910 không còn đáp ứng được yêu cầu đào tạo các mô hình AI tiên tiến một cách tối ưu về chi phí. Tuy nhiên, khi xét về khả năng suy luận, bộ xử lý này có thể đạt 60% hiệu suất của Nvidia H100, theo nghiên cứu của DeepSeek. Dù không phải là chip AI mạnh nhất, Ascend 910C có thể đóng góp vào việc giảm sự phụ thuộc của Trung Quốc vào GPU Nvidia.

Huawei cải thiện hiệu suất suy luận với Ascend 910C
Các thử nghiệm của DeepSeek chỉ ra rằng Ascend 910C đã vượt qua kỳ vọng về khả năng suy luận, và nếu được tối ưu hóa thủ công với các kernel CUNN, hiệu suất có thể còn tốt hơn nữa. Nhờ sự hỗ trợ toàn diện của DeepSeek cho bộ xử lý Ascend và kho lưu trữ PyTorch, việc chuyển đổi từ CUDA sang CUNN trở nên đơn giản, giúp dễ dàng tích hợp phần cứng của Huawei vào quy trình AI.
Dù đối mặt với các lệnh trừng phạt từ Mỹ và bị hạn chế trong việc tiếp cận công nghệ sản xuất chip tiên tiến của TSMC, Huawei vẫn tiếp tục có những bước tiến đáng kể trong lĩnh vực chip AI. SMIC, đối tác sản xuất của Huawei, đã nhanh chóng bắt kịp TSMC trong giai đoạn 2019–2020 và cho ra mắt một chip có thể cạnh tranh với Nvidia A100 và H100.
Hạn chế của Ascend 910C: Đào tạo AI vẫn là thế mạnh của Nvidia
Mặc dù đạt kết quả tích cực trong suy luận, Ascend 910C vẫn chưa phải là sự lựa chọn tối ưu cho đào tạo AI, một lĩnh vực mà Nvidia vẫn duy trì vị trí dẫn đầu. Theo ông Yuchen Jin, đại diện của DeepSeek, vấn đề lớn nhất của các bộ xử lý AI Trung Quốc là thiếu tính ổn định khi đào tạo dài hạn. Điều này xuất phát từ việc Nvidia đã phát triển hệ sinh thái phần cứng và phần mềm trong hơn hai thập kỷ, tạo ra lợi thế vượt trội trong ngành.

Ascend 910C tiếp tục sử dụng thiết kế chiplet, với SoC tính toán chính chứa khoảng 53 tỷ bóng bán dẫn. Trong khi Ascend 910 trước đây sử dụng chiplet tính toán do TSMC sản xuất với tiến trình N7+ (7nm EUV), Ascend 910C đã chuyển sang tiến trình N+2 (thế hệ thứ hai của 7nm) do SMIC sản xuất.
Tương lai của AI: Liệu Huawei có thể thoát khỏi sự thống trị của Nvidia?
Một số chuyên gia dự đoán rằng khi các mô hình AI tiếp tục tiến tới kiến trúc Transformer, hệ sinh thái phần mềm của Nvidia có thể không còn duy trì lợi thế tuyệt đối. Đồng thời, sự tập trung của DeepSeek vào tối ưu hóa phần cứng và phần mềm có thể giúp giảm sự phụ thuộc vào GPU của Nvidia, mở ra lựa chọn tiết kiệm chi phí hơn, đặc biệt trong lĩnh vực suy luận AI.
Tuy nhiên, để có thể cạnh tranh toàn cầu, Trung Quốc cần giải quyết vấn đề về tính ổn định khi đào tạo mô hình AI và liên tục nâng cấp cơ sở hạ tầng tính toán AI. Nếu vượt qua được khó khăn này, Huawei có thể trở thành đối thủ cạnh tranh mạnh mẽ trong ngành phần cứng AI, tạo cơ hội thay thế GPU Nvidia trong nhiều ứng dụng chiến lược.
