Mặc dù mô hình của startup Trung Quốc khiến 600 tỷ USD vốn hóa bay hơi, Nvidia vẫn khen ngợi vì lý do rất thuyết phục.

Vừa qua, Nvidia đã mất đi 600 tỷ USD vì một mô hình AI đến từ Trung Quốc. Ảnh: Getty Images
Mô hình đang tạo ra một "cơn địa chấn" chưa từng có trong ngành AI chính là sản phẩm của DeepSeek. Startup AI DeepSeek của Trung Quốc hiện đang thu hút sự chú ý từ giới công nghệ toàn cầu. Theo CNBC, người phát ngôn của Nvidia đã gọi mô hình R1 của DeepSeek là "tiến bộ AI tuyệt vời". Công trình này minh chứng cho khả năng tạo ra các mô hình mới nhờ kỹ thuật Test Time Scaling.
Trong thực tế, kỹ thuật Test Time Scaling mà Nvidia đưa ra cho phép một mô hình AI được huấn luyện kỹ lưỡng và dành thời gian lâu hơn trong quá trình suy luận để đưa ra dự đoán hoặc tạo ra ảnh, văn bản. Nhờ đó, kết quả đạt được sẽ chính xác hơn.
Đánh giá của Nvidia được đưa ra sau khi DeepSeek phát hành mô hình R1. Mô hình suy luận mở này được cho là vượt trội so với các mô hình tốt nhất của Mỹ. Hiện tại, theo DeepSeek, chi phí đào tạo R1 chỉ chưa đến 6 triệu USD. Số tiền này chỉ bằng một phần nhỏ so với hàng tỷ USD mà các công ty Silicon Valley phải bỏ ra để phát triển các mô hình AI.
Đặc biệt, mô hình của DeepSeek đã khiến cổ phiếu công nghệ toàn cầu giảm mạnh. Vào ngày 27/1, cổ phiếu Nvidia đã mất 17% giá trị, tương đương với việc mất 600 tỷ USD vốn hóa, mức thiệt hại lớn nhất trong lịch sử của một doanh nghiệp Mỹ.
Đặc biệt, GS Yann LeCun, người được gọi là "Bố già AI", nhà khoa học AI của Meta, đã dành lời khen cho DeepSeek. Theo ông, mô hình AI của DeepSeek chứng minh rằng các mô hình nguồn mở đang vượt qua các mô hình độc quyền. GS LeCun chia sẻ trên Threads: "Họ đã nghĩ ra ý tưởng mới và phát triển dựa trên công trình của người khác. Vì công trình của họ là mã nguồn mở, mọi người có thể tận dụng được. Đây chính là sức mạnh của nghiên cứu và nguồn mở".
Các chuyên gia cho rằng tuyên bố mới của Nvidia có thể ám chỉ rằng cách tiếp cận đột phá của DeepSeek đang tạo ra nhu cầu lớn hơn cho bộ xử lý đồ họa (GPU) của Nvidia. Việc suy luận yêu cầu số lượng GPU khổng lồ. Thêm vào đó, phát ngôn viên của Nvidia khẳng định GPU mà DeepSeek đang sử dụng hoàn toàn tuân thủ quy định kiểm soát xuất khẩu của Mỹ.
Trước thực trạng này, nhiều nhà phân tích bắt đầu đặt câu hỏi liệu khoản đầu tư hàng tỷ USD của các công ty như Microsoft, Google và Meta vào hạ tầng AI có thực sự hợp lý hay không khi mà kết quả có thể đạt được với chi phí thấp hơn nhiều.
Nhiều chuyên gia đang nghi ngờ về chi phí cực thấp của AI Trung Quốc?
Sau khi mô hình DeepSeek gây bão, cổ phiếu của nhiều công ty công nghệ Mỹ, trong đó có Nvidia, đã giảm mạnh. Công ty đứng sau DeepSeek cho biết họ đã mất 12 tháng để phát triển mô hình này, với chi phí chưa đến 6 triệu USD. Họ sử dụng 800 GPU đã bị Nvidia hạ cấp sức mạnh để tuân thủ lệnh cấm của Mỹ, thay vì dùng các mẫu chip AI tiên tiến nhất trên thị trường.
Tuy nhiên, việc ra mắt bất ngờ một sản phẩm mới với chi phí cực kỳ rẻ và khả năng vượt trội khiến startup DeepSeek từ Trung Quốc bị một số chuyên gia nghi ngờ.

Alexandr Wang, CEO của Scale AI. Ảnh: Forbes
Trong một cuộc phỏng vấn với CNBC vào tuần trước, ông Alexandr Wang, CEO của Scale AI, đã chia sẻ thông tin rằng startup DeepSeek đang sở hữu đến 50.000 chip Nvidia H100. Tuy nhiên, do các biện pháp kiểm soát xuất khẩu của Mỹ, DeepSeek không thể công khai thông tin này.
Ngoài ra, tỷ phú Elon Musk, người giàu nhất thế giới và là nhà sáng lập xAI, cũng bày tỏ sự đồng tình. Ông Musk cũng đã chia sẻ về những nghi ngờ liên quan đến chi phí phát triển DeepSeek từ Gavin Baker, CIO của quỹ đầu cơ Atreides Management.

Tỷ phú Elon Musk cũng tỏ ra nghi ngờ về chi phí 6 triệu USD mà DeepSeek đưa ra. Ảnh: Blocktrends
Ông Gavin Baker khẳng định rằng thông tin về việc DeepSeek R1 được phát triển với chi phí 6 triệu USD là không chính xác. Vị chuyên gia này dẫn lại báo cáo kỹ thuật từ nhà phát triển Trung Quốc, chỉ ra rằng con số đó không tính đến các chi phí liên quan đến các nghiên cứu trước, thử nghiệm loại bỏ trên kiến trúc, thuật toán và dữ liệu. Điều này có nghĩa là mô hình R1 có thể được đào tạo với chi phí 6 triệu USD, nếu như phòng thí nghiệm đã chi hàng trăm triệu USD cho nghiên cứu trước đó và có quyền truy cập vào các cụm phần cứng mạnh mẽ hơn rất nhiều.
Ông Baker còn cho biết trong một báo cáo trước đây của DeepSeek đã tham chiếu đến một cụm 100.000 chip A100 và ám chỉ rằng các công ty Trung Quốc như DeepSeek có thể đang "lách luật" bằng cách chạy các mô hình AI trên các chip tiên tiến tại một quốc gia khác.
Mặc dù có nhiều nghi ngờ, mô hình của DeepSeek vẫn đang tạo nên cơn sóng trên thị trường chứng khoán Mỹ. Đặc biệt, startup AI từ Trung Quốc này còn khiến nhiều "gã khổng lồ" như Nvidia, Microsoft và Meta phải lên tiếng.

DeepSeek đang thu hút sự chú ý của các công ty công nghệ toàn cầu. Ảnh: BBC
DeepSeek hiện là ứng dụng mới nhất trong số các sản phẩm đến từ Trung Quốc. Ứng dụng này đã trở nên ngày càng phổ biến tại Mỹ trong thời gian gần đây.
Nguồn tham khảo: CNBC, Fortune, Insider
