Dù đang thống trị thị trường một mình, NVIDIA chưa bao giờ để mình chìm đắm trong chiến thắng.

Nvidia đặt tham vọng "soán ngôi" thị trường điện toán với dòng chip AI tiên tiến mới
Nvidia đang chuẩn bị ra mắt một bộ vi xử lý mới được thiết kế đặc biệt nhằm hỗ trợ OpenAI và các đối tác khác tạo ra các công cụ nhanh chóng và hiệu quả hơn. Sự kiện này dự đoán sẽ tạo ra một bước ngoặt lớn trong hoạt động kinh doanh của hãng, đồng thời thay đổi cuộc chơi trong lĩnh vực trí tuệ nhân tạo (AI).
Theo các nguồn tin thân cận, Nvidia đang phát triển một hệ thống mới phục vụ cho "điện toán suy luận" – một dạng xử lý giúp các mô hình AI phản hồi nhanh chóng các truy vấn từ người dùng. Hệ thống này sẽ được giới thiệu tại Hội nghị phát triển GTC của Nvidia diễn ra ở San Jose vào tháng tới. Đặc biệt, hệ thống sẽ sử dụng chip do startup Groq thiết kế.

Điện toán suy luận đang là lĩnh vực cạnh tranh khốc liệt nhất trong ngành. Những ông lớn như Google và Amazon cũng đã phát triển các dòng chip riêng để đối đầu trực tiếp với các hệ thống chủ lực của Nvidia. Hơn nữa, sự phát triển mạnh mẽ của lập trình tự động trong ngành công nghệ đã đẩy nhu cầu về các loại chip mới có khả năng xử lý các tác vụ phức tạp liên quan đến AI hiệu quả hơn.
Việc OpenAI đồng ý trở thành một trong những khách hàng lớn nhất của bộ vi xử lý mới này được xem là chiến thắng quan trọng đối với Nvidia. Cha đẻ của , vốn là khách hàng lớn của Nvidia, đã dành nhiều tháng để tìm kiếm các giải pháp thay thế hiệu quả hơn cho chip của Nvidia, thậm chí còn ký hợp đồng với một startup chip khác vào tháng trước để mở rộng các lựa chọn của mình.
Trước đó, OpenAI đã gián tiếp nhắc đến bộ vi xử lý mới khi thông báo sẽ ký hợp đồng mua sắm lớn về "năng lực suy luận chuyên dụng" từ Nvidia, cùng với khoản đầu tư lên đến 30 tỷ USD từ gã khổng lồ ngành chip này. Đồng thời, OpenAI cũng đã ký kết một thỏa thuận quan trọng khác để sử dụng chip Trainium của Amazon.
Vượt qua giới hạn

Từ trước đến nay, Nvidia luôn chiếm ưu thế trong lĩnh vực thiết kế và kinh doanh GPU (đơn vị xử lý đồ họa) – loại chip có khả năng thực hiện hàng tỷ tác vụ đồng thời. Tuy nhiên, lần đầu tiên kể từ khi AI bùng nổ, hãng đang phải đối mặt với thách thức từ chính sản phẩm chủ lực của mình. Khi thị trường chuyển sang điện toán suy luận, Nvidia đang chịu áp lực lớn từ khách hàng để tạo ra các dòng chip có khả năng vận hành các ứng dụng AI hiệu quả hơn.
Các dòng GPU mạnh mẽ của Nvidia như Hopper, Blackwell và Rubin vẫn được coi là "tiêu chuẩn vàng" trong việc huấn luyện các mô hình AI quy mô lớn và luôn đi kèm với mức giá cao. Hầu hết các nhà phân tích đều ước tính rằng Nvidia đang nắm giữ hơn 90% thị phần GPU.
Giám đốc điều hành Nvidia, ông Jensen Huang, từ lâu đã khẳng định rằng GPU của công ty không chỉ dẫn đầu trong mảng huấn luyện mà còn trong cả mảng suy luận, và chính sự linh hoạt này là điểm mạnh cốt lõi của sản phẩm.
Tuy nhiên, trong năm qua, nhu cầu về điện toán cao cấp đã chuyển từ huấn luyện sang suy luận, khi các doanh nghiệp bắt đầu triển khai các "tác nhân AI" (AI agents) và các công cụ khác. Họ kỳ vọng rằng những công cụ này sẽ làm thay đổi diện mạo của hàng trăm ngành công nghiệp và mang lại lợi nhuận khổng lồ từ phí thuê bao. Các "tác nhân" này là những hệ thống AI có thể hoạt động khá độc lập để thực hiện các nhiệm vụ thay cho người dùng.
Nhiều công ty xây dựng và vận hành các tác nhân AI đã nhận thấy rằng GPU quá đắt đỏ, tiêu tốn quá nhiều năng lượng và không thực sự tối ưu cho việc vận hành các mô hình của họ. Với sự trỗi dậy mạnh mẽ của "AI tác nhân" (agentic AI), Nvidia đang đối mặt với sức ép phải phát triển các dòng chip suy luận có chi phí thấp hơn và tiết kiệm năng lượng hơn.
Giải pháp của Nvidia
Tháng trước, OpenAI đã ký kết một thỏa thuận điện toán trị giá hàng tỷ USD với Cerebras – công ty cung cấp dòng chip chuyên dụng cho suy luận mà CEO Andrew Feldman khẳng định có tốc độ nhanh hơn cả GPU của Nvidia. Tờ The Journal đã đưa tin rằng OpenAI đã bắt đầu đàm phán với Cerebras từ mùa thu năm ngoái, sau khi các kỹ sư của hãng yêu cầu một loại chip suy luận nhanh hơn cho các ứng dụng lập trình bằng tác nhân AI.

Vào cuối năm ngoái, Nvidia đã đồng ý chi ra 20 tỷ USD để mua bản quyền các công nghệ quan trọng từ Groq và chiêu mộ đội ngũ lãnh đạo cấp cao của startup này, bao gồm cả người sáng lập Jonathan Ross. Theo The Wall Street Journal, đây được coi là một trong những thương vụ thu mua nhân tài lớn nhất trong lịch sử Thung lũng Silicon.
Groq đã phát triển các loại chip sử dụng kiến trúc hoàn toàn khác biệt so với Nvidia, gọi là "đơn vị xử lý ngôn ngữ" (LPUs), vốn rất hiệu quả cho các tác vụ suy luận. Tuy nhiên, Nvidia vẫn chưa tiết lộ kế hoạch sử dụng công nghệ của Groq trong tương lai như thế nào.
Quá trình điện toán suy luận AI được chia thành hai tác vụ chính: pre-fill (quá trình mô hình giải mã câu lệnh của người dùng) và decode (quá trình mô hình tạo phản hồi từ từng từ một). Thông thường, pre-fill nhanh hơn, trong khi decode có xu hướng đặc biệt chậm đối với các mô hình AI lớn.
Các ứng dụng lập trình đã trở thành một trong những mục đích sử dụng quan trọng và mang lại lợi nhuận cao nhất cho AI trong doanh nghiệp, với Claude Code của Anthropic thường được coi là người dẫn đầu thị trường. Tuy nhiên, Anthropic chủ yếu sử dụng chip từ Amazon Web Services và Google Cloud thay vì Nvidia để vận hành các mô hình của mình.
Dù vậy, một trong những đối thủ đáng gờm nhất của Claude là công cụ Codex của OpenAI, hiện đang phát triển mạnh mẽ. Các nguồn tin cho biết OpenAI dự định sử dụng hệ thống mới của Nvidia để nâng cấp và cải thiện Codex.
Thông thường, Nvidia kết hợp chip Vera (CPU) với GPU Rubin trong các máy chủ trung tâm dữ liệu mạnh mẽ. Tuy nhiên, một số khách hàng lớn đã nhận thấy rằng một số khối lượng công việc của AI tác nhân có thể hoạt động hiệu quả hơn chỉ với CPU.
Tháng này, Nvidia đã công bố mở rộng quan hệ đối tác với Meta Platforms, trong đó bao gồm việc triển khai lần đầu tiên hệ thống chỉ sử dụng CPU trên quy mô lớn để hỗ trợ các tác nhân AI nhắm mục tiêu quảng cáo của Meta. Thỏa thuận này mở ra cái nhìn sớm về chiến lược của Nvidia: mở rộng tầm nhìn xa hơn GPU để chiếm lĩnh mọi ngóc ngách của thị trường AI.
