Các startup hiện đang nỗ lực để chứng minh khả năng của mình khi đối đầu với Nvidia, gã khổng lồ trong ngành công nghiệp chip.
Các công ty khởi nghiệp tại châu Á đang quyết tâm chứng minh rằng họ có thể cung cấp các giải pháp chip vượt trội hơn so với Nvidia. Họ tin rằng mức tiêu thụ năng lượng cao và thiết kế cồng kềnh của GPU sẽ tạo ra cơ hội cho các công ty mới lấp đầy khoảng trống này.
Có hai loại chip AI chính: Chip “suy luận” dùng để vận hành các mô hình AI hiện tại và chip “đào tạo” với khả năng xử lý dữ liệu cao, được sử dụng để phát triển các mô hình AI mới.
Ví dụ, OpenAI cần hàng chục nghìn chip đào tạo để phát triển các mô hình mới cho chatbot . Ngược lại, khi trả lời một câu hỏi, nó sử dụng chip suy luận.
Toru Nishikawa, CEO của kỳ lân AI Nhật Bản Preferred Networks (PFN), chia sẻ với Nikkei Asia rằng: “Chưa có ai tìm ra kiến trúc chip hoàn hảo cho suy luận. Tôi dự đoán sẽ có những thay đổi lớn về kiến trúc trong ngành này. Ai cung cấp sản phẩm với mức giá thấp nhất sẽ chiến thắng.”
Thành công của Nvidia chủ yếu đến từ việc đào tạo nhờ vào khả năng của GPU trong xử lý hàng triệu phép toán song song. Tuy nhiên, GPU quá đắt và cồng kềnh để được sử dụng trong máy tính xách tay và thiết bị đeo. Ví dụ, chip AI của Nvidia cho trung tâm dữ liệu có giá từ 25.000 đến 40.000 USD, cao gấp 7-8 lần so với các sản phẩm thông thường.
“Nếu chi phí của chip suy luận tương đương với chip đào tạo, mô hình kinh doanh đó sẽ không thể bền vững”, Nishikawa chia sẻ. “Chúng ta cần phát triển chip AI có thể hoạt động trên máy tính cá nhân”.
Các nhà phân tích đều đồng tình. “Có sự kỳ vọng rằng nhu cầu về AI trên thiết bị sẽ tăng lên trong thời gian tới, và điều này đang thúc đẩy các công ty đầu tư mạo hiểm gia nhập cuộc chiến”, Kazuhiro Sugiyama, giám đốc tư vấn của Omdia từ Anh cho biết.
Các lĩnh vực tiềm năng cho AI trên thiết bị bao gồm máy tính cá nhân, điện thoại thông minh, camera giám sát và máy bay không người lái.
“GPU của Nvidia chủ yếu phù hợp cho việc đào tạo, nhưng chúng tôi đang chứng kiến nhiều công ty mới phát triển loại chip có thể phục vụ cả đào tạo lẫn suy luận”, Sugiyama bổ sung.
Những công ty mới này bao gồm SambaNova Systems từ Mỹ, được Quỹ Vision của SoftBank tài trợ; Tenstorrent, do một cựu kỹ sư Intel sáng lập; và Graphcore từ Anh, gần đây đã được SoftBank mua lại. Các gã khổng lồ công nghệ như Google, Meta và Amazon Web Services cũng đang tham gia, cùng với đối thủ AMD của Nvidia.
“Từ năm 2025 đến 2026, chúng ta sẽ thấy nhiều công ty tham gia vào thị trường hơn”, Sugiyama cho biết, đồng thời nhấn mạnh rằng vấn đề lớn nhất với sản phẩm của Nvidia là giá. “Một chip Nvidia có thể có giá lên tới 25.000 USD, đây là gánh nặng lớn đối với những công ty muốn đầu tư vào AI”.
Ngay cả các nhà cung cấp của Nvidia cũng đã bày tỏ lo ngại về mức giá.
“Các công ty đang tìm cách sử dụng chip của riêng họ thay vì phải phụ thuộc vào chip đắt đỏ của Nvidia”, Chey Tae-won, chủ tịch SK Group từ Hàn Quốc, chia sẻ tại một hội nghị vào tháng 7.
“Tôi tin rằng mô hình kinh doanh hiện tại của Nvidia có thể bị thay đổi”.
Theo Nikkei Asia, giá cả không phải là vấn đề duy nhất. Chip Blackwell thế hệ mới của Nvidia tiêu thụ lên tới 1.200 watt điện.
“Trước đây, một con chip tiêu thụ hơn 100 watt đã được coi là cực kỳ tốn điện”, một đại diện của công ty khởi nghiệp chip Esperanto Technologies từ Mỹ cho biết tại một cuộc họp báo ở Tokyo. Một số chuyên gia ước tính rằng việc đào tạo một mô hình như -3 tiêu tốn nhiều điện hơn mức tiêu thụ của 1.000 hộ gia đình trong một năm.
Do đó, PFN và các đối tác, bao gồm một viện nghiên cứu quốc gia, đang hướng tới việc phát triển chip tăng tốc AI thế hệ mới vào tháng 3 năm 2027: mạnh mẽ hơn và tiêu tốn ít năng lượng hơn so với chipset B200 của Nvidia, theo Junichiro Makino, giám đốc thiết kế chip tại PFN. Nói cách khác, PFN hy vọng sẽ cải thiện hiệu quả của chip AI qua phần mềm.
Mặc dù đây là chip đào tạo, PFN tin rằng công nghệ này có thể được tối ưu hóa để cung cấp các giải pháp suy luận hiệu quả về mặt chi phí. “Nếu muốn khai thác thị trường đang phát triển, chúng tôi cần một chip suy luận mới trong 2-3 năm tới”, Makino cho biết.
GPU chưa bao giờ được thiết kế để đáp ứng nhu cầu của cuộc cách mạng AI. Chúng ban đầu chỉ được dùng để xác định màu sắc của hàng triệu pixel trong trò chơi điện tử. Mỗi phép toán tương đối đơn giản, nhưng để xử lý đồ họa chuyển động nhanh ở độ phân giải cao, cần hàng nghìn lõi hoạt động đồng thời.
Vào đầu những năm 2000, các nhà nghiên cứu đã phát hiện ra tiềm năng của GPU. Kentaro Sano, trưởng nhóm nghiên cứu bộ xử lý tại viện nghiên cứu quốc gia Riken, cho biết khả năng xử lý đồng thời với tốc độ cao, cùng với các cải tiến và phần mềm bổ sung của Nvidia, đã khiến GPU trở thành sự lựa chọn tối ưu cho các nhà khoa học AI.
“Dù kiến trúc của GPU hiện tại không phải là tối ưu nhất, nhưng nó vẫn là giải pháp tốt nhất cho việc xử lý đa mục đích so với các sản phẩm khác hiện có”, Sano cho biết.
Nvidia đang sản xuất các chip AI tùy chỉnh. Công ty tập trung vào việc điều chỉnh nền tảng phần mềm của mình để phù hợp với các ứng dụng cụ thể, như AI hoặc xe tự lái.
“Nvidia khó có thể thay đổi kiến trúc của mình thành một hình thức hoàn toàn khác với GPU. ... Họ chỉ sản xuất cùng một loại chip, và đó chính là lý do họ đạt được hiệu quả kinh tế”, ông cho biết.
Khi được hỏi về chiến lược nghiên cứu và phát triển trong tương lai, Nvidia trả lời Nikkei Asia rằng “sẽ không bình luận về các sản phẩm chưa được công bố”.
Theo một nguồn tin trong ngành, Nvidia đang áp dụng cách tiếp cận đa mục đích và ưu tiên các chip có khả năng xử lý nhiều AI tiên tiến. Các công ty khởi nghiệp có thể tìm kiếm lợi thế cạnh tranh bằng cách tập trung thiết kế vào các ứng dụng cụ thể.
Đây là một phần trong chiến lược của Edgecortix, một startup chip AI từ Nhật Bản do cựu kỹ sư Microsoft và IBM, Sakyasingha Dasgupta, đứng đầu. Công ty cho biết chip của họ được thiết kế đặc biệt cho các ứng dụng AI trong môi trường hạn chế, như thiết bị hoặc máy công nghiệp, hoạt động với chỉ 1/10 công suất so với GPU để đạt hiệu suất tương đương.
Sugiyama dự đoán rằng Nvidia sẽ duy trì được 30% đến 40% thị phần trong ngành chip AI, chủ yếu nhờ vào ưu thế của họ trong lĩnh vực chip đào tạo. Điều này buộc các công ty khởi nghiệp phải cạnh tranh gay gắt để chiếm lĩnh các phân khúc thị trường ngách.
“Nếu cách tiếp cận của ngành đối với tính toán AI thay đổi hoàn toàn, sự thống trị của GPU có thể sẽ kết thúc”, Sano từ Riken cho biết, tuy nhiên ông vẫn cho rằng Nvidia có lợi thế nhờ vào các khoản đầu tư vào công nghệ mới. Điều này lý giải tại sao một số công ty khởi nghiệp coi Châu Á là khu vực chiến lược quan trọng hơn so với phương Tây.
“Châu Á - Thái Bình Dương hiện đang có một vị trí rất quan trọng. Đó chính là một trong những lợi thế của chúng tôi”, ông Dasgupta chia sẻ.
Nguồn: Nikkei Asia