Để đối phó với tình hình, Nvidia đã thực hiện một động thái táo bạo bằng cách ký kết thỏa thuận cấp phép trị giá 20 tỷ USD với Groq, qua đó chặn đứng các cuộc thảo luận giữa Groq và OpenAI.

Theo tin từ Reuters, sự thống trị của Nvidia trong kỷ nguyên AI đang gặp phải thử thách nghiêm trọng từ chính OpenAI. Dù đang đàm phán khoản đầu tư khổng lồ lên tới 100 tỷ USD, CEO Sam Altman và các cộng sự của OpenAI lại âm thầm hợp tác với các đối thủ của Jensen Huang từ Nvidia, vì lo ngại về tốc độ của sản phẩm.
Căng thẳng
Trong suốt thời gian qua, Nvidia gần như không có đối thủ trong lĩnh vực chip đồ họa (GPU) phục vụ huấn luyện các mô hình ngôn ngữ lớn. Tuy nhiên, khi chuyển sang giai đoạn "Inference" (Suy luận), tức là khi AI phản hồi yêu cầu thực tế từ người dùng trong các ứng dụng như , điểm yếu của Nvidia bắt đầu lộ diện.
Nguồn tin từ Reuters cho biết, OpenAI đã bày tỏ sự không hài lòng về một số dòng chip mới của Nvidia từ năm ngoái. Vấn đề chính là tốc độ phản hồi, đặc biệt là trong các tác vụ cần sự ngay lập tức như lập trình (Codex) hoặc khi AI giao tiếp với các phần mềm khác.
Trong khi Nvidia và AMD vẫn dựa vào bộ nhớ ngoài, tạo ra độ trễ nhất định, OpenAI lại tìm kiếm những dòng chip có bộ nhớ SRAM tích hợp trực tiếp trên silicon để tối ưu hóa hiệu suất và giảm thiểu độ trễ.

Theo Reuters, quan hệ giữa OpenAI và Nvidia đang cực kỳ căng thẳng. Mặc dù Nvidia dự tính đầu tư tới 100 tỷ USD vào OpenAI để đổi lấy cổ phần và đảm bảo công ty này có đủ tài chính để mua chip cao cấp, các cuộc đàm phán lại kéo dài nhiều tháng thay vì chỉ vài tuần như dự định ban đầu.
Nguyên nhân của sự chậm trễ này là vì kế hoạch sản phẩm của OpenAI đã thay đổi. Họ bắt đầu ký kết hợp đồng với AMD và tìm kiếm sự hỗ trợ từ các startup chuyên về chip như Cerebras và Groq. Đây là một đòn đánh mạnh vào tham vọng độc quyền của Nvidia.
Để đối phó, Nvidia đã ký kết thỏa thuận cấp phép trị giá 20 tỷ USD với Groq, nhằm ngăn chặn ngay lập tức các cuộc đàm phán giữa Groq và OpenAI.
Thực tế, OpenAI có lý do chính đáng để lo ngại. Các đối thủ trực tiếp như Google với Gemini hay Anthropic với Claude đang tận dụng các chip tự thiết kế (TPU), được tối ưu cho các phép toán suy luận, đem lại hiệu suất vượt trội so với các GPU đa năng của Nvidia.
CEO Sam Altman đã thừa nhận rằng khách hàng sử dụng mô hình lập trình đặt ra yêu cầu cực kỳ cao về tốc độ. Để đáp ứng nhu cầu này, OpenAI công bố thỏa thuận với Cerebras vào tháng trước, sau khi startup này từ chối đề nghị mua lại từ Nvidia. Mục tiêu của OpenAI là biến các phần cứng thay thế này thành nguồn cung cấp 10% nhu cầu tính toán suy luận trong tương lai.

Dù Jensen Huang và Sam Altman đều tuyên bố trên mạng xã hội X rằng mối quan hệ vẫn tốt, nhưng các dấu hiệu ngầm lại cho thấy thực tế khác. Nvidia đang cố gắng củng cố danh mục công nghệ của mình bằng cách thâu tóm các tài sản trí tuệ quan trọng để không bị bỏ lại phía sau trong mảng Inference.
Trong khi đó, OpenAI khẳng định họ sẽ không chịu làm 'con tin' của bất kỳ nhà cung cấp phần cứng nào, dù người đó có tấm séc 100 tỷ USD trong tay. Cuộc đua AI giờ đây không chỉ là cuộc đua về thuật toán, mà còn là cuộc chiến giành giật từng phần nghìn giây trong tốc độ xử lý phần cứng.
*Nguồn: Reuters
