Trong thời gian gần đây, cuộc cạnh tranh trong lĩnh vực AI đang trở nên căng thẳng hơn bao giờ hết với sự xuất hiện của DeepSeek – một mô hình AI từ Trung Quốc được cho là vượt trội hơn hẳn các đối thủ Mỹ về hiệu quả chi phí.
Chatbot nguồn mở của DeepSeek đã nhanh chóng leo lên vị trí số một trong App Store tại 51 quốc gia và mới đây còn được tiết lộ rằng nó đang vận hành trên các chip AI của Huawei.
Cụ thể, mô hình DeepSeek R1 LLM (mô hình ngôn ngữ lớn) được huấn luyện trên Nvidia H100 nhưng sử dụng chip Ascend 910C để thực hiện suy luận, tức là quá trình sử dụng mô hình đã huấn luyện để tạo ra các phản hồi.
Thông tin này được chia sẻ bởi @Dorialexander, người cho biết rằng chip Ascend không tham gia vào việc huấn luyện mô hình, vì vậy yêu cầu về công suất GPU không quá khắt khe.

Mặc dù vậy, hiệu suất không quá mạnh mẽ của chip Ascend 910C khiến nó chưa thật sự phù hợp cho các mục đích đào tạo. Huawei dự định giải quyết vấn đề này với chip Ascend 920C sắp ra mắt, cạnh tranh trực tiếp với Blackwell B200, chipset Nvidia hàng đầu dành cho AI. Bạn có suy nghĩ gì về việc DeepSeek chọn sử dụng chip Huawei?
Nguồn: GSMArena
- AI Agents trên Galaxy S25 Series là gì? Gồm những tính năng gì?
- Những tính năng Galaxy AI mới trên Galaxy S25 series: Quyền năng hơn, hiểu rõ người dùng hơn bao giờ hết
