Chỉ trong 18 tháng, lượng token AI tiêu thụ hàng ngày tại Trung Quốc đã tăng lên gấp 300 lần, vượt qua các ông lớn công nghệ của Mỹ.

Mới đây, tại sự kiện do Citadel Securities tổ chức, CEO Jensen Huang của Nvidia đã thẳng thắn chia sẻ: "Trước đây, chúng tôi chiếm 95% thị phần tại Trung Quốc, nhưng giờ đây con số này đã về 0%."
Câu nói này như một lời thừa nhận rằng Trung Quốc đang vươn lên mạnh mẽ như một hiện tượng công nghệ đáng chú ý trong khu vực, chứng minh rõ ràng khát vọng không chỉ bắt kịp mà còn vượt qua phương Tây trong cuộc đua AI toàn cầu.
Sự phát triển này được thúc đẩy từ hai hướng: một bên là sức mạnh phần cứng đầy tham vọng của Huawei, và bên kia là tốc độ tăng trưởng mạnh mẽ của các ứng dụng phần mềm, thể hiện qua sự gia tăng mạnh mẽ trong tiêu thụ token.
Quy mô bù hiệu năng
Sự kiện Huawei Connect vừa qua đã chứng kiến sự ra mắt ấn tượng của dòng chip AI Ascend 950, thách thức trực tiếp vị thế của Nvidia, ông lớn công nghệ đến từ Mỹ.
Với băng thông liên kết nội bộ ấn tượng, được công bố lên đến 2 TB/s cho thế hệ chip Ascend 950, và lộ trình tiếp theo là Ascend 960 (2027) và Ascend 970 (2028), điểm đáng chú ý không phải chỉ là việc tăng xung hoặc thêm số lượng core, mà là việc hỗ trợ các định dạng số ít bit như FP8/MXFP8, đồng thời thiết kế để dễ dàng mở rộng thành các "SuperPoD" hay "SuperCluster".

Mặc dù các lệnh cấm vận từ Washington vẫn là một rào cản lớn đối với việc tiếp cận công nghệ chip tiên tiến, Huawei đã tìm ra cho mình một con đường riêng biệt: chiến lược "SuperNode + Cluster" hay nói cách khác là "dùng quy mô để bù đắp hiệu năng".
Thay vì nỗ lực chế tạo một con chip vượt trội hơn sản phẩm của Nvidia (thực tế, các nhà phân tích thừa nhận chip Ascend hiện vẫn còn tụt lại phía sau), Huawei tập trung vào việc xây dựng các siêu cụm (SuperPoD) quy mô khổng lồ.
Hệ thống Atlas 950 SuperPoD mới được thiết kế để kết nối hơn 8.000 chip Ascend, và các phiên bản tương lai như Atlas 960 có thể kết nối tới gần 16.000 chip. Huawei tự tin tuyên bố rằng ở cấp độ hệ thống, SuperPoD của họ mang lại sức mạnh tính toán và băng thông kết nối dữ liệu vượt trội, thậm chí gấp hàng chục lần so với các hệ thống sắp ra mắt từ đối thủ Mỹ.
Đây là một nước cờ táo bạo, tận dụng kinh nghiệm của Huawei về kết nối và cơ sở hạ tầng mạng để biến hạn chế trong công nghệ chế tạo chip thành lợi thế quy mô hệ thống.
Trong khi đó, nếu cuộc chiến chip là một sân chơi căng thẳng của phần cứng, thì lĩnh vực ứng dụng AI tại Trung Quốc lại chứng kiến sự bứt phá mạnh mẽ từ phần mềm. Tốc độ tăng trưởng phi thường trong việc sử dụng "token", đơn vị đo lường cơ bản cho hoạt động của các mô hình ngôn ngữ lớn (LLMs), cho thấy AI đang được triển khai rộng rãi trong đời sống và kinh doanh của quốc gia này.
Token là đơn vị nhỏ nhất để đo lường "lượt việc" mà mô hình ngôn ngữ thực hiện, tức là càng ngày càng có nhiều người dùng, dịch vụ, bot và hệ thống tự động hoạt động với quy mô cực lớn.
Chỉ trong vòng 18 tháng (từ đầu năm 2024 đến giữa năm 2025), mức tiêu thụ token AI hàng ngày của Trung Quốc đã tăng lên 300 lần, từ 100 tỷ token lên hơn 30 nghìn tỷ. Dù các công ty công nghệ lớn của Mỹ như Google và Microsoft cũng ghi nhận mức tăng trưởng đáng kể, nhưng tốc độ phát triển của Trung Quốc được cho là đã vượt trội.

Theo thông tin từ TechCrunch, Google đã thông báo mức tiêu thụ token tăng từ khoảng 9,7 nghìn tỷ token/tháng vào tháng 4/2024 lên 480 nghìn tỷ token/tháng vào tháng 4/2025, tương đương với mức tăng gấp 50 lần. Microsoft cũng cho biết dịch vụ Azure AI đã xử lý hơn 100 nghìn tỷ token trong Quý I/2025, mức tăng trưởng gấp 5 lần.
Thị trường AI của Trung Quốc trong năm 2023 ước tính đạt khoảng 60 tỷ USD, thấp hơn so với 87 tỷ USD của Mỹ, nhưng khoảng cách này đang được thu hẹp nhanh chóng. Trong nghiên cứu học thuật, Trung Quốc cũng gia tăng mạnh mẽ về số lượng bài báo AI, từ chưa đến 5% vào năm 2000 lên khoảng 36% vào năm 2025.
Cục Dự trữ Liên bang Mỹ (Fed) cho biết một yếu tố quan trọng là Trung Quốc vẫn còn nhiều tiềm năng để mở rộng cơ sở hạ tầng AI, trong khi Mỹ lại đang đối mặt với nhiều thách thức về vấn đề này trong các dự án AI tại nền kinh tế lớn nhất thế giới.
Các con số ấn tượng từ Trung Quốc phản ánh rằng việc ứng dụng AI không chỉ dừng lại ở các phòng thí nghiệm mà đã được tích hợp sâu rộng vào các dịch vụ như chatbot, dịch thuật, tự động hóa quy trình, và viết nội dung, tạo nên một hệ sinh thái AI đang phát triển mạnh mẽ.
Việc tiêu thụ token AI đang trở thành một chỉ số mới, ngang tầm với các chỉ số kinh tế truyền thống, phản ánh quy mô thực tế của việc triển khai các mô hình ngôn ngữ lớn (LLMs). Đây là minh chứng rõ ràng cho thấy dù Mỹ vẫn dẫn đầu về đầu tư và chất lượng mô hình, Trung Quốc đang dẫn đầu về tốc độ chuyển đổi và ứng dụng AI vào nền kinh tế thực.
Huawei rõ ràng đang thực hiện một chiến lược độc đáo, không chỉ cạnh tranh về từng teraflop hay mỗi quy trình sản xuất, mà đầu tư vào giải pháp toàn diện, bao gồm chip và bộ nhớ HBM nội địa, cùng mạng liên kết siêu tốc, nhằm gom hiệu năng thành một thực thể duy nhất để huấn luyện và phục vụ các mô hình AI quy mô hàng trăm tỷ đến nghìn tỷ tham số.
Khi việc sử dụng token gia tăng mạnh, nhu cầu về I/O, băng thông và khả năng phân phối tải trở nên rất lớn. Đây chính là điểm mà Huawei tin rằng họ có lợi thế nếu triển khai SuperPod/Cluster với quy mô đủ lớn.

Bài toán bền vững
Sự phát triển mạnh mẽ của AI đang tạo ra một hiệu ứng kinh tế vĩ mô độc đáo tại Trung Quốc. Trong bối cảnh nền kinh tế đang đối mặt với nguy cơ giảm phát (giá cả giảm), theo lý thuyết kinh tế truyền thống, các doanh nghiệp thường sẽ giảm sản xuất.
Tuy nhiên, nhờ vào việc áp dụng rộng rãi AI, nhiều ngành nghề tại Trung Quốc, từ du lịch văn hóa đến sản xuất, vẫn duy trì được mức cung và sản lượng ổn định, bất chấp tỷ lệ việc làm giảm và giá cả đi xuống.
Công nghệ AI đã đóng vai trò như một "chất xúc tác" mạnh mẽ giúp giảm chi phí và tăng hiệu quả hoạt động. Điều này cho phép doanh nghiệp duy trì năng suất ngay cả trong giai đoạn kinh tế khó khăn, báo hiệu một sự thay đổi căn bản trong mối quan hệ giữa lao động, sản lượng và chu kỳ kinh tế.
Tuy nhiên, không chỉ có số liệu và máy móc. Lệnh hạn chế từ Mỹ và các vấn đề chuỗi cung ứng toàn cầu đã tạo ra những giới hạn thực tế. Nhiều dự đoán cho rằng Huawei có thể sản xuất không quá 200.000 chip AI cao cấp trong năm 2025 do hạn chế công nghệ đóng gói và tiếp cận với các node tiên tiến. Con số này không đủ để đáp ứng nhu cầu toàn quốc nếu tất cả các bên đều tham gia, và điều này phơi bày lỗ hổng trong chiến lược "quy mô" khi thiếu nguồn cung vật lý bền vững.
Ngoài ra, hệ sinh thái phần mềm như trình biên dịch, thư viện tối ưu, hệ thống phân tán và đặc biệt là "mô hình" vẫn là một rào cản lớn. Nvidia có CUDA, một hệ sinh thái phong phú với hàng nghìn nhà phát triển đã tối ưu cho GPU. Huawei cần hơn cả chip để thuyết phục các nhà phát triển chuyển sang nền tảng mới. Nếu chỉ có phần cứng mà thiếu phần mềm dễ dùng và cộng đồng, việc đạt được hiệu quả quy mô như mong muốn có thể gặp khó khăn.
Câu chuyện về AI của Trung Quốc hiện tại đang có hai dòng phát triển song song và liên kết chặt chẽ: một là sự tăng trưởng mạnh mẽ về ứng dụng phần mềm, với người dùng, dịch vụ và token đạt mức tăng vượt trội, và một là nỗ lực đưa phần cứng vào cuộc chơi thông qua quy mô siêu lớn.
Nếu hai yếu tố này hòa hợp, nghĩa là phần cứng đủ khả năng phục vụ nhu cầu và phần mềm đủ mạnh để tận dụng tối đa nguồn lực, Trung Quốc sẽ có thể duy trì ưu thế về tốc độ triển khai các ứng dụng. Ngược lại, nếu chuỗi cung ứng hay hệ sinh thái phần mềm gặp khó khăn, quy mô lớn cũng sẽ đối mặt với giới hạn thực tế.
Tóm lại, nhờ vào chiến lược phần cứng "lấy quy mô lớn" của Huawei và sự bùng nổ các ứng dụng AI, Trung Quốc không chỉ củng cố vị thế mà còn xây dựng một mô hình tăng trưởng kinh tế mới, trong đó AI đóng vai trò động lực chủ chốt. Thế giới sẽ phải theo dõi sát sao, bởi cuộc đua AI đã không còn là một cuộc đua đơn giản.
*Nguồn: SCMP, Fortune, BI
