Thị trường Đen ChatGPT ở Trung Quốc Đang Phát Đạt

Yuxin Guo là một sinh viên thạc sĩ đang học tại một trường đại học ở Bắc Kinh. Trong vài tháng, cô đã theo dõi các cuộc thảo luận trực tuyến về ChatGPT, công cụ trí tuệ nhân tạo tạo sinh tạo ra ngôn ngữ gần như tự nhiên khi đáp ứng các yêu cầu văn bản. Một video mà cô tìm thấy trên nền tảng truyền thông xã hội Weibo cho thấy sinh viên đại học ở Mỹ đang sử dụng công nghệ này để viết bài nghiên cứu. Vào tháng 2, cô cuối cùng đã quyết định thử nghiệm nó cho bản thân mình.
“Tôi trở nên tò mò vì nhiều người đang nói về nó,” Guo nói, “mặc dù có vẻ không nhiều người biết cách truy cập nó một cách rõ ràng.”
ChatGPT không có sẵn ở Trung Quốc—nó không bị chặn, nhưng OpenAI, người đã xây dựng công cụ này, chưa làm cho nó có sẵn ở đó—nên Guo đã truy cập Taobao, trang thương mại điện tử lớn nhất của Trung Quốc, nơi hàng trăm ngàn nhà cung cấp cung cấp mọi thứ từ ốp iPhone đến bằng lái xe nước ngoài.
Các tài khoản đăng nhập của ChatGPT đã trở thành hàng hóa nóng trên Taobao, cũng như số điện thoại nước ngoài - đặc biệt là những số ảo có thể nhận mã xác minh. Một tìm kiếm đơn giản trên nền tảng này vào đầu tháng 2 trả về hơn 600 cửa hàng bán tài khoản, với giá dao động từ 1-30 RMB (0.17-4.28 USD). Một số cửa hàng đã thực hiện hàng nghìn giao dịch. Trên WeChat của Tencent, một thị trường sôi động cho các bản sao của ChatGPT đã nảy lên - chủ yếu thông qua các chương trình con (các ứng dụng phụ trên nền tảng) như “ChatGPT Online”. Những ứng dụng này cung cấp cho người dùng một số câu hỏi miễn phí trước khi tính phí sử dụng chatbot. Hầu hết chúng là trung gian - họ đặt câu hỏi ChatGPT cho người dùng và sau đó gửi câu trả lời lại. Trên Baidu, công cụ tìm kiếm lớn nhất của Trung Quốc, “Cách sử dụng ChatGPT trong nước” đã liên tục nổi lên trong vài tuần.
Quy mô của thị trường đen về quyền truy cập vào ChatGPT - và sự phát triển không ngừng của những bản sao - cho thấy có nhiều nhu cầu tiềm ẩn đối với các sản phẩm AI sáng tạo tại Trung Quốc, nhưng cũng đặt ra những thách thức đối với các công ty muốn phát triển chúng. Tính “hộp đen” của AI sáng tạo làm cho việc dự đoán kết quả của chatbot trở nên khó khăn, điều này có thể nguy hiểm trên internet của Trung Quốc được kiểm soát mạnh mẽ.
“Các công ty lớn của Trung Quốc phát triển một sản phẩm giống như ChatGPT đặt vào tình thế căng trước hai ưu tiên lớn nhất của chính phủ Trung Quốc: lãnh đạo trong lĩnh vực AI và kiểm soát thông tin”, nói Matt Sheehan, một nghiên cứu viên tại Carnegie Endowment for International Peace nghiên cứu về hệ sinh thái AI của Trung Quốc.
Các ông lớn công nghệ của Trung Quốc đã nhanh chóng đuổi kịp OpenAI và đưa sản phẩm của họ ra thị trường - mặc dù một số trong số họ đã đang làm việc trên các mô hình ngôn ngữ lớn từ nhiều năm trước.
Vào ngày 7 tháng 2, Baidu công bố sẽ ra mắt bot Ernie (tên gọi là “Wen Xin Yi Yan” trong tiếng Trung) để thử nghiệm nội bộ vào tháng 3. Bot sẽ được xây dựng dựa trên mô hình ngôn ngữ lớn Ernie 3.0-Titan mà Baidu đã phát triển từ năm 2019.
Baidu cho biết bot sẽ có khả năng đưa ra phản ứng trò chuyện với các yêu cầu bằng tiếng Anh và chủ yếu sẽ tập trung vào việc hiểu rõ sự tinh tế của tiếng Trung. Cuối cùng, nó sẽ được tích hợp vào công cụ tìm kiếm và trợ lý giọng nói Xiaodu của công ty và sẽ được sử dụng trong các dự án AI Cloud và Apollo tự lái của Baidu, theo lời của CEO Baidu Robin Li trong cuộc họp cổ đông quý 4 năm 2022 của công ty.
Ngày Baidu công bố, cổ phiếu của công ty đã tăng 15% trên sàn chứng khoán Hong Kong.
Một tuần sau tin tức của Baidu, iFlyTech, một công ty AI nổi tiếng với hệ thống nhận diện giọng nói, công bố bot AI riêng của mình. iFlyTech cho biết sẽ ra mắt bot vào tháng 5 và rất tự tin về việc đạt được bước nhảy công nghệ tương tự như ChatGPT. Vào ngày 27 tháng 2, Tencent thông báo đã hình thành một đội ngũ mới nội bộ để phát triển sản phẩm thay thế của họ cho ChatGPT, có tên là HunyuanAide. Trong khi đó, các công ty thương mại điện tử như Alibaba và JD.com cũng như ông lớn trong ngành game là NetEase đều tuyên bố đang làm việc trên các bot trò chuyện AI.
Wang Huiwen, người sáng lập Meituan, đại gia giao hàng đồ ăn, đã rời hưu vào tháng 2, đăng trên nền tảng truyền thông xã hội Jike rằng ông đang tuyển dụng nhân sự để xây dựng một đối thủ của OpenAI. Ông nói rằng ông đã có được 230 triệu đô la vốn đầu tư riêng, cộng thêm 50 triệu đô la của chính mình, để tài trợ cho dự án.
Chính phủ Trung Quốc cũng đã nhận ra sự quan trọng của việc phát triển trí tuệ nhân tạo tạo sinh. Một bản sách trắng được phát hành vào ngày 13 tháng 2 bởi Sở Kinh tế và Thông tin Thành phố Bắc Kinh, nơi tổ chức và quy định một số lượng lớn các công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc, hứa hỗ trợ “các công ty nội địa hàng đầu trong việc tạo ra các mô hình cạnh tranh với ChatGPT.”
“Người đứng đầu trong cuộc đua để xây dựng một ChatGPT trong nước tại Trung Quốc sẽ là những công ty đã đặt nền tảng của mình trong việc xây dựng các mô hình lớn giống như GPT-3,” nhấn mạnh Jeffery Ding, giáo sư trợ giảng khoa chính trị tại Đại học George Washington, đề cập đến gia đình mô hình ngôn ngữ lớn GPT-3 làm cơ sở của ChatGPT. Baidu, Huawei, Inspur và Tencent đều đã xây dựng những mô hình này, Ding nói và có thể không xa lạ với các công ty Mỹ.
Liu Jun, phó chủ tịch cấp cao của Inspur Information và giám đốc điều hành trí tuệ nhân tạo, nói với MYTOUR rằng mô hình Yuan 1.0 của Inspur có 245,7 tỷ tham số và một bộ dữ liệu 5 TB, và hiện nay có cộng đồng phát triển mã nguồn mở với hơn 3.000 thành viên. Theo một bài báo được xuất bản vào năm 2021 của Baidu, Ernie 3.0 Titan có 260 tỷ tham số và một bộ dữ liệu 4 TB. So với đó, GPT-3 của OpenAI có khoảng 175 tỷ tham số.
Huawei, Baidu và Tencent đều không phản hồi lại yêu cầu ý kiến từ MYTOUR.
Mặc dù gần như hoàn toàn được đào tạo bằng tiếng Anh, ChatGPT đã thể hiện khả năng tạo văn bản tiếng Trung khá lưu loát, nhưng làm điều này một cách chậm rãi, với khoảng trễ năm giây so với tiếng Anh, theo kiểm tra của MYTOUR trên phiên bản miễn phí. Người dùng đã chỉ ra trên mạng xã hội rằng văn bản đôi khi vẫn nghe như là đã được dịch.
Điều này có thể là do vẫn còn rất ít tài liệu cho các mô hình thu thập dữ liệu, mặc dù quy mô của Internet Trung Quốc rất lớn. “Thiếu hụt văn bản tiếng Trung chất lượng tốt có thể là một vấn đề,” Ding nói, chỉ ra rằng có gấp đôi số lượng mục Wikipedia bằng tiếng Anh so với tiếng Trung.
Những đặc điểm ngôn ngữ của tiếng Trung từ lâu đã làm cho việc xây dựng lập trình ngôn ngữ tự nhiên khó khăn. Tiếng Trung thường mang tính ngữ cảnh hơn tiếng Anh và sử dụng nhiều thành ngữ và phép diễn đạt phức tạp hơn. Tuy nhiên, từ năm 2017, sự phát triển của mạng nơ-ron “transformer”, có khả năng học ngữ cảnh từ các bộ dữ liệu, đã giúp các nghiên cứu vượt qua vấn đề này.
“Tính chất cao ngữ cảnh của ngôn ngữ Trung Quốc trước đây tạo ra những rào cản trong xử lý ngôn ngữ tự nhiên,” nói Thomas Qitong Cao, một nghiên cứu sinh tiến sĩ tại Đại học Stanford nghiên cứu về hành vi chính trị và internet. “Nhưng khoảng cách giữa các ngôn ngữ đã giảm đáng kể trong thời đại của các mô hình ngôn ngữ lớn được đào tạo trước.”
Cao nói rằng thách thức của việc đào tạo mô hình trí tuệ nhân tạo bằng tiếng Trung kiểm tra kích thước và chất lượng của các bộ dữ liệu, cũng như công suất tính toán.
Các công ty cũng sẽ phải đối mặt với sự kiểm duyệt của chính phủ đối với những chủ đề mà nó coi là nhạy cảm. Các nền tảng truyền thông xã hội ở Trung Quốc đã sử dụng sự kết hợp giữa thuật toán và các quản trị viên con người để theo dõi nội dung và loại bỏ bất kỳ điều gì vi phạm các quy tắc liên tục thay đổi của chính phủ về điều được phép và không được phép.
Các công ty công nghệ sẽ cần theo dõi chặt chẽ sản phẩm của chatbots, một công việc có lẽ sẽ liên quan đến việc sử dụng các quản trị viên con người. “Có khả năng chúng ta sẽ thấy hình thức kiểm duyệt dựa vào con người này, kết hợp với các chiến thuật khác như chặn từ khóa, được sử dụng trong các chatbot phát triển công khai,” Cao nói.
Một cuộc điều tra của Time phát hiện rằng OpenAI đang trả công nhân Kenya dưới 2 đô la mỗi giờ để làm cho ChatGPT ít độc hại hơn.
Tuy nhiên, bản chất của chatbot, mà đầu ra không luôn có thể dự đoán hoặc kiểm soát bởi người tạo ra chúng, có nghĩa là không thể tránh khỏi việc các công ty sẽ gặp vấn đề, theo ý kiến của Sheehan từ Viện Carnegie.
“[Có] hai luật AI công cộng tập trung vào thuật toán đề xuất và deepfakes, tương ứng, điều này chứng tỏ rằng chính phủ Trung Quốc có ưu tiên hàng đầu là giám sát nội dung mà người dùng tiêu thụ trực tuyến,” Sheehan nói. “Nội dung do trí tuệ nhân tạo tạo ra rơi vào hạng mục này, và có thể dự kiến rằng các công ty cố gắng tạo ra ChatGPT riêng của họ sẽ gặp vấn đề với Cơ quan Quản lý Không gian Trực tuyến của Trung Quốc.”
Các nền tảng công nghệ Trung Quốc đã bắt đầu đàn áp việc truy cập ChatGPT trên thị trường đen. Đến cuối tháng Hai, MYTOUR phát hiện rằng các từ khóa “ChatGPT” và “OpenAI” đã bị cấm trên Taobao. Trên WeChat, “ChatGPT Online” và các dịch vụ tương tự đã tái thương hiệu thành các tên nghe neutral như “AI Smart Chat.”
Các trung gian phụ thuộc vào API (cung cấp cho các lập trình viên quyền truy cập vào phía sau hệ thống ChatGPT) và vào các tài khoản được đăng ký hàng loạt. “Những trung gian này thu lợi bằng cách truyền dịch vụ của ChatGPT cho người dùng không có quyền truy cập trực tiếp. Chỉ trong quá trình này, các bên liên quan đã vi phạm các điều khoản và điều kiện của ChatGPT, cũng như các thương hiệu và bằng sáng chế liên quan khác,” nói Ivan Wang, một luật sư chuyên nghiệp về sở hữu trí tuệ có trụ sở tại New York.
Dữ liệu về số người sử dụng ChatGPT ở Trung Quốc đã tìm ra cách để vượt qua các hạn chế không khả dụng, nhưng sự lan truyền của các điểm truy cập không chính thức ít nhất cung cấp một số trường hợp sử dụng cho trí tuệ nhân tạo sáng tạo.
Echo Liu, một quản lý sản phẩm công nghệ, trả 189 RMB (27,50 đô la) cho một tài khoản OpenAI với ChatGPT Plus, một dịch vụ đăng ký thử nghiệm mang lại quyền truy cập ưu tiên cho người dùng. “Tôi đặc biệt kinh ngạc bởi khả năng của ChatGPT giải thích ngôn ngữ phức tạp bằng ngôn ngữ đơn giản,” cô nói. Liu nâng cấp lên ChatGPT Plus sau khi trải qua sự trễ trong việc đáp ứng khi nói chuyện với ChatGPT bằng tiếng Trung và hiện đang cố gắng học lập trình thông qua nó.
Một số doanh nhân nhỏ bán hàng nước ngoài đã tích hợp ChatGPT vào công việc hàng ngày của họ.
Tao Ye, chủ sở hữu của dịch vụ logistics toàn cầu mang tên OL Warehouse, cho biết công ty của ông đã bắt đầu sử dụng ChatGPT trong các câu hỏi của khách hàng ở quy mô nhỏ. “Chúng tôi đang thử nghiệm để ChatGPT viết các thông điệp dịch vụ khách hàng, và đã đạt được kết quả tốt,” ông nói.
Rachel, người quản lý một trang web thương mại điện tử nhỏ dành cho khán giả nói tiếng Anh và chỉ muốn được nhận diện bằng tên đầu tiên để tránh sự theo dõi chính thức, cho biết cô đã sử dụng hệ thống để giúp viết bản sao. Trên nền tảng truyền thông xã hội RED của Trung Quốc, bài đăng của Rachel chia sẻ cách tích hợp ChatGPT vào thương mại điện tử xuyên biên đã được hơn 2,000 lượt thích. Cô trước đây đã thuê một người viết tự do đến từ Ấn Độ trên trang web microtasking Fiverr để viết bài blog của mình với giá 20 đô la mỗi bài, nhưng cô bây giờ đã quyết định chuyển sang sử dụng ChatGPT hoàn toàn.
“Viết mô tả sản phẩm và bài đăng blog bằng tiếng Anh chính xác trước đây là một nỗi đau đầu đối với tôi,” cô nói. “ChatGPT giờ đây đã nhanh chóng đẩy nhanh quá trình niêm yết và giao tiếp của chúng tôi.”
