Câu hỏi trọng điểm hiện nay không còn là Huawei có thể làm chip mạnh đến mức nào, mà là họ sản xuất được bao nhiêu chiếc và triển khai rộng ra đâu trước khi Nvidia tiến thêm bước nữa.
Huawei đang chuẩn bị bước vào giai đoạn thử nghiệm chip AI mạnh nhất của mình - Ascend 910D, với tham vọng cạnh tranh trực tiếp cùng GPU H100 của Nvidia và các thế hệ kế tiếp như Blackwell, Rubin. Trong bối cảnh bị hạn chế tiếp cận tiến trình bán dẫn tiên tiến do lệnh cấm từ Mỹ, Huawei chọn cách bù đắp điểm yếu ở chip đơn bằng việc xây dựng pod xử lý quy mô lớn, lấy sức mạnh từ hệ thống chứ không chỉ dựa vào silicon đơn lẻ.
Đối thủ của H100, nhưng không đi theo con đường Nvidia
Theo Reuters, Huawei đã liên hệ nhiều công ty công nghệ trong nước để khảo sát khả năng triển khai Ascend 910D thực tế. Mẫu thử đầu tiên của chip này dự kiến sẽ ra mắt vào cuối tháng 5. Về lý thuyết, 910D có thể vượt H100 về tổng hiệu năng trong hệ thống nhiều chip, dù hiệu năng từng chip vẫn kém GPU Blackwell B200 và nhất là dòng Rubin thế hệ mới.

Huawei đang cung cấp dòng chip Ascend 910C - phiên bản hai chiplet - với hiệu năng khoảng 780 TFLOPS (chuẩn BF16), so với 2.000 TFLOPS của H100. Điều này khiến công ty phải suy nghĩ khác: thay vì chạy theo hiệu suất đơn lẻ, họ gom hàng trăm chip vào một hệ thống duy nhất - như cụm CloudMatrix 384 từng giới thiệu trước đây với 384 chip Ascend 910C.
Ở cấp độ hệ thống, Huawei chứng minh họ vẫn có thể cạnh tranh. CloudMatrix 384 có thể vượt Nvidia GB200 NVL72 trong một số tác vụ AI, dù đổi lại là mức tiêu thụ điện cao gấp gần 4 lần và mật độ hiệu suất thấp hơn. Nhưng trong chiến lược của Huawei, hiệu quả điện năng không phải là ưu tiên chính, mà là khả năng triển khai thực tế và tự chủ công nghệ trong bối cảnh nguồn lực sản xuất bị hạn chế.
Dòng chip Ascend 910D được kỳ vọng sẽ cải tiến từ 910C với thay đổi về kiến trúc nội bộ và tăng số lượng chiplet. Vẫn chưa rõ nơi sản xuất chip, nhưng có hai kịch bản được đề cập: hoặc Huawei tiếp tục dùng nhà máy nước ngoài qua bên thứ ba như với 910C, hoặc sản xuất tại Trung Quốc qua SMIC, dù tiến trình hiện tại còn kém hơn TSMC.
Thế trận 2025: Rubin của Nvidia có thể mạnh hơn, nhưng khó thâm nhập thị trường Trung Quốc
Đến năm 2026, Nvidia dự kiến ra mắt GPU Rubin trên tiến trình N3 hoặc cao hơn, hiệu năng gấp đôi B200 trong các tác vụ AI (khoảng 8.300 TFLOPS ở FP8). Trong khi đó, nếu Huawei thành công với 910D và mở rộng CloudMatrix thế hệ mới, họ có thể đạt hiệu năng cạnh tranh ở cấp độ rack - dù chip đơn lẻ kém hơn.
Vấn đề không chỉ là hiệu suất mà còn là khả năng tiếp cận thị trường. Với lệnh cấm xuất khẩu phần cứng AI vào Trung Quốc siết chặt, Nvidia gần như không thể bán Rubin tại đây, khiến Huawei trở thành nhà cung cấp mặc định cho thị trường nội địa - bất chấp ưu nhược điểm công nghệ.
Trong bối cảnh hiện nay, Ascend 910D có thể không “ấn tượng” về chỉ số hiệu suất điện năng trên giấy tờ. Nhưng trong chiến lược AI quốc gia, điều đó không phải rào cản. Nếu Huawei sản xuất đủ số lượng và triển khai rộng rãi, họ có thể xây dựng các “siêu cụm AI nội địa” với năng lực tương đương hoặc gần bằng các hệ thống phương Tây.
Anh Việt
