Đến thời điểm hiện tại, chính phủ Bắc Kinh đã cấp phép cho hơn 40 mô hình ngôn ngữ lớn hoạt động, cũng như cho phép sử dụng các ứng dụng thương mại dựa trên những mô hình AI này cho cộng đồng. Đồng thời, các nhà quản lý cũng đã thiết lập các biện pháp khuyến khích sự phát triển, bằng cách miễn thuế và cung cấp các khoản hỗ trợ từ chính phủ cho các startup.
Đua nhau trong nghiên cứu LLM và chatbot AI
Zhipu AI hiện tại là một trong những startup AI có quy mô nhân sự lớn nhất. Bắt đầu từ một dự án nghiên cứu của sinh viên và nghiên cứu sinh tại đại học Thanh Hoa, một trong những trường đào tạo chuyên gia nghiên cứu AI hàng đầu của Trung Quốc, Zhipu hiện đã có hơn 800 nhân viên, với giá trị ước tính lên đến 2.5 tỷ USD theo hai nhà đầu tư. Số vốn huy động được sau các vòng gọi vốn chưa được tiết lộ cụ thể.
Trong khi đó, Moonshot, do Yang Zhilin, người học của giáo sư Tang Jie, đã thành lập và được định giá lên đến 2.5 tỷ USD, sau khi gọi vốn thành công 1 tỷ USD vào tháng 2/2024. Trước đó, Yang đã làm việc tại Meta AI và Google Brain AI dưới dạng thực tập sinh, cũng như thành lập Recurrent AI, một đơn vị phát triển công cụ phân tích cuộc gọi cho telesale.
Moonshot, Zhipu và 01.ai đều phát triển chatbot AI dành cho nhân viên văn phòng và sinh viên, với trợ lý ảo có khả năng xử lý văn bản dài và tối ưu kết quả tìm kiếm trực tuyến. Chatbot Kimi của Moonshot, được phát triển và vận hành dựa trên tên tiếng Anh của Yang, đang cạnh tranh trực tiếp với trợ lý ảo Ernie Bot của tập đoàn công nghệ Baidu. Hồi tháng 3, Kimi ghi nhận 12.6 triệu lượt truy cập, so với 14.9 triệu lượt của Ernie Bot, dựa trên thống kê từ Aicpb.com.
Đối mặt với áp lực về hiệu năng xử lý lớn để vận hành chatbot AI dựa trên LLM như Kimi của Moonshot, một số đơn vị đã chọn cách sử dụng chatbot avatar với những nhân vật được yêu thích. Trò chuyện với các chatbot này đơn giản hơn, không đòi hỏi sức mạnh tính toán lớn để mô hình LLM có thể tư duy lý luận. Các chatbot avatar cho phép mọi người thảo luận một cách dễ dàng hơn, chỉ cần được huấn luyện dựa trên một lượng dữ liệu tương đối ít, và vận hành cũng đơn giản hơn nhờ vào tham số nội suy thấp.
Chưa có giải pháp hoàn hảo và đơn vị nào nổi bật hẳn
Một nhà nghiên cứu AI tại Trung Quốc nói: “Sao chép ChatGPT rất khó. Mô hình là sản phẩm chính. Tạo các chatbot avatar giải trí dễ hơn, thậm chí có thể chỉ cần một mô hình mã nguồn mở và ít dữ liệu, sau đó hiệu năng máy chủ cũng không cần quá cao.”
Cả Zhipu và MiniMax đều có chatbot AI vận hành, mô phỏng cách nói chuyện của nhân vật manga và anime được nhiều người yêu thích. Những câu hỏi và câu trả lời của người dùng và AI được thu thập để hoàn thiện mô hình ngôn ngữ trong tương lai.
01.ai, do một trong những người dẫn đầu trong ngành AI ở Trung Quốc, Kai-Fu Lee, sáng lập, đã phát hành một loạt mô hình AI mã nguồn mở mang tên Yi, dựa trên kiến trúc LLaMa của Meta, và tối ưu hóa cho thị trường và ngôn ngữ Trung Quốc. Hugging Face đánh giá cao mô hình Yi, đặc biệt về khả năng lý luận, toán học, đọc văn bản và lập trình. 01.ai cũng có một chatbot tên là Wanzhi.
Đơn vị này gần đây đã thu hút vốn thành công, nâng giá trị vốn hóa lên 1.2 tỷ USD, theo một nguồn tin không tiết lộ tên. Một số nhà đầu tư chính rót tiền cho 01.ai bao gồm Xiaomi, Alibaba Cloud và Sinovation Venture, quỹ đầu tư do Kai-Fu Lee sáng lập.
Trong khi vẫn chưa có đơn vị nào được coi là đứng đầu ngành và chưa có sản phẩm nào phổ biến tại thị trường Trung Quốc đến mức mọi người đều nghĩ đến như ChatGPT ở phương Tây, theo phó giáo sư Jeffrey Ding ở đại học George Washington, chuyên gia hệ sinh thái AI Trung Quốc, rất khó để tìm ra giải pháp AI tốt nhất:
“Rất khó để phân biệt những ứng dụng giống nhau. Bạn sẽ không thể biết ứng dụng nào của đơn vị nào hiệu quả hơn cho công việc và cuộc sống.”
Phát triển ở mức độ phù hợp
Một điểm chung trong cả 4 hình tóm tắt của 4 đơn vị nghiên cứu AI hàng đầu tại Trung Quốc: Tất cả đều nhận được đầu tư từ tập đoàn Alibaba. Dễ nhận thấy rằng tập đoàn công nghệ lớn này đang cố gắng sao chép thành công của Microsoft khi đầu tư 13 tỷ USD vào OpenAI. Tuy nhiên, nếu nhìn từ góc độ tổng thể, cả quy mô và số lượng các nhà đầu tư đổ tiền vào cuộc đua phát triển mô hình ngôn ngữ và chatbot AI đều ít hơn rất nhiều so với trước đây. Số liệu không thể so sánh được với thời điểm các quỹ đầu tư đầu tư vào các công ty AI nhận diện khuôn mặt như SenseTime hay Megvii. Và hầu hết các nhà đầu tư nước ngoài không tham gia.
Bên cạnh nguồn vốn dồi dào, các startup AI ở Trung Quốc nhận ra rằng, họ có đủ tài năng kỹ thuật và cũng đủ tài nguyên máy chủ để huấn luyện các mô hình AI hiện tại, mặc dù gặp khó khăn trong việc tiếp cận GPU xử lý AI mạnh nhất do cấm vận chip bán dẫn từ Mỹ. Một nhân viên của một startup phát triển AI cho biết: “Các dịch vụ điện toán đám mây ở Trung Quốc có đủ GPU Nvidia họ lấy trước khi cấm vận từ Mỹ có hiệu lực, đủ để huấn luyện các mô hình AI hiện tại.” Tuy nhiên, hai nhân viên ở các startup AI khác cho biết, họ đang tập trung vào việc phát triển sản phẩm sử dụng tài nguyên máy chủ ở mức độ phù hợp. Chính việc tài nguyên máy chủ đám mây bị hạn chế đã thúc đẩy nhiều startup ở Trung Quốc tận dụng các mô hình AI mã nguồn mở như LLaMa của Meta để xây dựng các mô hình AI của riêng họ, thay vì có tài chính và tài nguyên đủ để xây dựng một mô hình AI từ đầu.
Một ưu điểm khác của cuộc đua nghiên cứu phát triển AI tại Trung Quốc là chi phí lao động cho các kỹ sư AI ở đây thấp hơn nhiều so với ở châu Âu và Mỹ. Một tiến sỹ khoa học máy tính tốt nghiệp từ một trường đại học tại Trung Quốc thường kiếm được từ 80 đến 240 nghìn USD tại một startup lớn. Con số này ở Silicon Valley ít nhất cũng phải gấp bốn lần. Một nhà đầu tư startup công nghệ ở Trung Quốc thừa nhận: “Các công ty Trung Quốc không phải lúc nào cũng giỏi trong việc xây dựng nền tảng công nghệ. Tuy nhiên, họ rất tinh ý trong việc nắm bắt xu hướng ngành, theo dõi và thích ứng với sự phát triển tích cực, cùng tận dụng nguồn nhân lực chất lượng tại địa phương để học hỏi và phát triển từ những điều đã và đang thành công ở Mỹ.”