Phiên bản AI DeepSeek-R2 sắp chính thức ra mắt trong tháng 8, mang theo hàng loạt cải tiến đột phá vượt xa phiên bản tiền nhiệm.
Nguồn tin mới nhất tiết lộ DeepSeek đang gấp rút hoàn thiện mô hình ngôn ngữ lớn thế hệ mới - DeepSeek-R2, dự kiến ra mắt vào cuối tháng 8/2025. Thông tin này vô tình được tiết lộ qua hệ thống tương tác AI của chính hãng.

DeepSeek-R2 được kỳ vọng sẽ có bước đột phá về kiến trúc nhờ ứng dụng công nghệ Mixture of Experts (MoE) phiên bản cải tiến. Hệ thống còn được trang bị mạng lưới cổng logic thông minh giúp xử lý hiệu quả hơn các tác vụ đòi hỏi khả năng suy luận phức tạp.
Nguồn tin nội bộ tiết lộ mô hình mới có khả năng mở rộng quy mô lên tới 1.2 nghìn tỷ tham số, tăng gần 100% so với phiên bản tiền nhiệm DeepSeek-R1 (671 tỷ tham số). Tuy nhiên, quy mô này vẫn khiêm tốn hơn so với -4/5 với hơn 1.8 nghìn tỷ tham số.

Theo chiến lược phát triển AI nội địa, mô hình này hoàn toàn được huấn luyện trên hệ thống chip Ascend 910B của Huawei. Cụm máy tính Huawei đạt hiệu suất FP16 512 PFLOPS với tỷ lệ sử dụng 82%, được đánh giá tương đương 91% hiệu năng so với cụm A100 của Nvidia. Giới chuyên gia nhận định đây là bước đi then chốt trong nỗ lực giảm thiểu sự phụ thuộc của Trung Quốc vào phần cứng AI sản xuất tại Mỹ.
Nhờ tối ưu hóa phần cứng và kỹ thuật nội bộ, chi phí đào tạo DeepSeek-R2 được ước tính chỉ bằng 3% so với GPT-4. Giới chuyên gia dự đoán DeepSeek sẽ ra mắt API với giá thành cạnh tranh, có khả năng thách thức vị thế độc tôn của OpenAI và Anthropic trên thị trường.
Theo Gizmochina
- Trung Quốc công bố mô hình AI mới có giá thành còn rẻ hơn DeepSeek
- Điểm khác biệt nổi bật giữa Deepseek V3 và R1 khi ứng dụng thực tế
