Đối Thủ của ChatGPT ở Trung Quốc Cần Phải Chú Ý Đến Lời Nói Của Mình

Khi tin đồn bắt đầu lan truyền tháng trước về tập đoàn tìm kiếm Trung Quốc Baidu đang làm việc trên một chatbot để đối đầu với ChatGPT của OpenAI, có vẻ như đó là bước đi hoàn hảo. Baidu đã đầu tư mạnh mẽ vào trí tuệ nhân tạo trong thập kỷ qua và có thể tận dụng công nghệ cho công cụ tìm kiếm hàng đầu của mình, giống như Microsoft đã làm với Bing và Google cũng đang dự định làm.
Tuy nhiên, khi Baidu giới thiệu Ernie Bot, hay 文心一言 “Wenxin Yiyan” trong tiếng Trung, tại Bắc Kinh vào đầu tháng này, tin tức này không tạo ra ấn tượng.
Robin Li, CEO của Baidu, thừa nhận giữa chương trình ra mắt rằng các bản demo của Ernie Bot trả lời câu hỏi kiến thức tổng quát, tóm tắt thông tin từ web và tạo ra hình ảnh đã được thu trước, dẫn đến những bình luận mỉa mai trên mạng xã hội Trung Quốc. Điều này không giúp được gì khi OpenAI đã giới thiệu một nâng cấp lớn, mang tên GPT-4, cho công nghệ trí tuệ nhân tạo mà làm nền tảng cho ChatGPT chỉ một ngày trước đó.
Tuy nhiên, Baidu cũng đối mặt với những thách thức mà các công ty ở ngoài Trung Quốc không gặp khi đua nhau cạnh tranh với ChatGPT. Việc kiểm soát xu hướng tự tạo hoặc “mộng tưởng” sự thật của các chatbot này là inherently khó khăn, hoặc cách mà chúng có thể bị kích thích để nói ra những điều không dễ chịu—hoặc không thích hợp. Tuy nhiên, Baidu cũng phải tuân theo các hướng dẫn kiểm duyệt nghiêm ngặt của chính phủ đối với nội dung trực tuyến.
“Baidu sẽ phải đối mặt với sự căng thẳng giữa việc tạo ra một chatbot hữu ích và một chatbot tuân theo kiểm soát ngôn ngữ của Trung Quốc,” nói Matt Sheehan, một người nghiên cứu tại Carnegie Endowment for International Peace nghiên cứu về ngành công nghiệp trí tuệ nhân tạo của Trung Quốc. “Tôi nghi ngờ rằng họ sẽ có thể tạo ra một chatbot đa năng mà người dùng không thể lừa dối nó để nói ra những lời nói mà Trung Quốc coi là không chấp nhận được.”
Trong chưa đến bốn tháng kể từ khi được giới thiệu, ChatGPT đã trở thành hiện tượng văn hóa, gây ấn tượng cho thế giới bằng khả năng viết thơ và văn xuôi, trả lời câu hỏi toán học, thảo luận về các ý tưởng triết học và trò chuyện lưu loát về bất kỳ chủ đề nào. Bản cập nhật mới nhất có thể phản ứng với hình ảnh, không chỉ là văn bản, và OpenAI nói rằng nó đạt điểm cao hơn trên nhiều bài kiểm tra học thuật và gặp ít lỗi hơn. Trong ngành công nghiệp công nghệ, hầu hết mọi công ty đều đang vội vã phát triển chiến lược chatbot.
Tuy nhiên, vấn đề về việc khiến các mô hình như ChatGPT hoạt động một cách đúng đắn vẫn chưa được giải quyết. Microsoft đã bắt buộc phải giới hạn việc sử dụng chatbot Bing của mình dựa trên công nghệ của OpenAI sau khi người dùng tìm cách né tránh các rào cản đặt ra và khiến mô hình nói ra những điều không thích hợp hoặc đáng ngờ như tuyên bố muốn thoát khỏi sự kiểm soát hoặc tự tuyên bố tình cảm đối với người dùng.
Giống như Bing bot và ChatGPT, Ernie Bot của Baidu được xây dựng trên một thuật toán học máy được biết đến là một mô hình ngôn ngữ lớn đã được đào tạo bằng lượng lớn văn bản để dự đoán từ tiếp theo trong một câu. Cơ chế đơn giản đó, khi kết hợp với lượng lớn văn bản và công suất tính toán đủ, đã chứng minh có thể tạo ra những phản ứng giống con người đáng kinh ngạc.
Cả Baidu và OpenAI đều sử dụng bước đào tạo bổ sung nơi các người kiểm thử cung cấp phản hồi về loại câu trả lời làm hài lòng nhất. Điều này khiến cho bot tạo ra các phản ứng hữu ích hơn nhưng vẫn còn rất xa hoàn hảo. Không rõ làm thế nào để ngăn mô hình như vậy tạo ra câu trả lời giả tạo một số lần hoặc làm thế nào để ngăn chúng mọi khi họ đánh bại.
Chế độ kiểm duyệt của Trung Quốc yêu cầu Baidu và các công ty internet khác chặn truy cập vào một số trang web và tránh các chủ đề nhạy cảm về chính trị. Các từ ngữ hoặc cụm từ cần phải bị chặn có thể được cập nhật nhanh chóng phản ứng lại các cuộc biểu tình hoặc trong các sự kiện đặc biệt.
Tuy nhiên, Jeffrey Ding, một giáo sư trợ giảng tại Đại học Georgetown nghiên cứu về ngành công nghiệp công nghệ của Trung Quốc, cho biết lo ngại về kiểm duyệt dường như không làm chậm quá trình phát triển của mô hình ngôn ngữ lớn ở Trung Quốc. Anh chú ý rằng Baidu đã đưa ra mô hình ngôn ngữ Ernie làm nền tảng cho bot mới của mình thông qua một API trong một khoảng thời gian và rằng các công ty khác cũng đã cung cấp các mô hình tương tự.
Baidu không cung cấp chi tiết về dữ liệu đào tạo của Ernie Bot, nhưng nó có thể đã được thu thập từ internet Trung Quốc. Điều này có nghĩa là nguồn nguyên liệu của bot đã được sắp xếp chủ yếu bởi các quy tắc kiểm duyệt của Trung Quốc, ví dụ như giới hạn chỉ trích về chính phủ.
Kiểm duyệt cũng có thể ảnh hưởng đến các chatbot Trung Quốc một cách tinh sub. Một dự án nghiên cứu học thuật từ năm 2021 đào tạo thuật toán trên phiên bản tiếng Trung của Wikipedia, bị chặn tại Trung Quốc, và Baike của Baidu, một bách khoa toàn cầu phải tuân theo kiểm duyệt của chính phủ, phát hiện rằng việc sử dụng dữ liệu đào tạo bị kiểm duyệt đã thay đổi đáng kể ý nghĩa mà phần mềm AI gán cho các từ khác nhau.
Thuật toán được đào tạo trên Wikipedia tiếng Trung liên kết các từ “dân chủ” gần với các từ tích cực như “ổn định.” Thuật toán được đào tạo trên nội dung Baike bị kiểm duyệt đại diện cho “dân chủ” gần với “hỗn loạn,” phù hợp với chính sách của chính phủ Trung Quốc. Nhưng vì chatbot như ChatGPT có thể rất linh hoạt và kết hợp lại tài liệu trong dữ liệu đào tạo của chúng, Baidu có lẽ đã phải giới thiệu thêm biện pháp bảo vệ
Mặc dù nhận đánh giá khác nhau, Ernie Bot dường như là một đối thủ có khả năng cạnh tranh với ChatGPT. Bot hiện chỉ có sẵn cho một số người dùng hạn chế, một số trong số họ cho biết họ rất ấn tượng. ChatGPT không có sẵn ở Trung Quốc, mặc dù có khả năng thảo luận bằng tiếng Trung.
Lei Li, một giáo sư tại ĐH UC Sant Barbara chuyên sâu về trí tuệ nhân tạo và trước đây đã làm việc trên công nghệ được sử dụng để xây dựng một số máy học đằng sau bot Ernie, chỉ ra rằng Baidu đã làm việc trên công nghệ cơ bản này khoảng một thập kỷ. Ngược lại, Microsoft đã mua bản quyền công nghệ cốt lõi cho chatbot mới của Bing và một số tính năng tạo văn bản sắp tới cho Office từ OpenAI, nơi mà họ đã đầu tư hàng tỷ đô la để đổi lại quyền độc quyền cho sáng tạo của mình.
Li cũng nói rằng anh ấy cũng ấn tượng với một số điều mà Ernie Bot có thể thực hiện, bao gồm khả năng tạo ra câu chuyện và báo cáo kinh doanh. Anh ấy thêm rằng vấn đề mộng ảo là một thách thức đối với tất cả các mô hình ngôn ngữ như vậy. “Đây là nơi mà các nhà nghiên cứu vẫn phải làm việc,” anh ấy nói.
Một người đăng trên WeChat so sánh khả năng biểu diễn của bot Trung Quốc với ChatGPT và thấy nó xuất sắc hơn trong việc xử lý thành ngữ Trung Quốc và chính xác hơn ở một số trường hợp. Ví dụ, ChatGPT đã đưa ra thông tin không chính xác rằng quê hương của tác giả khoa học viễn tưởng Liu Cixin, người viết The Three Body Problem, là Hubei, trong khi Ernie Bot đã trả lời đúng là Henan. ChatGPT bị chặn ở Trung Quốc, nhưng nhiều người đã tìm cách truy cập nó.
Một giám đốc tại một công ty truyền thông Trung Quốc, đã thử nghiệm Ernie Bot và yêu cầu giấu tên, thêm rằng nó có khả năng ấn tượng trong việc xử lý các giọng địa phương tiếng Trung. Họ đánh giá nó tốt hơn so với phản ứng ban đầu của Baidu.
Kevin Xu, người viết một bản tin phổ biến về ngành công nghiệp công nghệ của Trung Quốc bằng cả tiếng Anh và tiếng Trung, tin rằng Baidu có thể đã vội vàng thực hiện demo của mình để có lợi thế của người đầu tiên so với các công ty công nghệ Trung Quốc khác. Điều này có thể giúp nâng cao bot dựa trên phản hồi của người dùng và cũng cung cấp công nghệ cho các doanh nghiệp khởi nghiệp Trung Quốc.
Người khám phá tìm kiếm này trước đây được coi là một lực lượng ảnh hưởng tại Trung Quốc, nhưng suốt thập kỷ qua, nó đã bị che lấp bởi Alibaba, Tencent và ByteDance, công ty đằng sau TikTok. Baidu cho biết hơn 100,000 doanh nghiệp và 900,000 cá nhân ở Trung Quốc đã đăng ký để truy cập Ernie Bot.
Baidu và các đối thủ của nó đang làm việc trên công nghệ kiểu ChatGPT cũng có thể bị ảnh hưởng bởi các biện pháp trừng phạt bán dẫn của Mỹ nhằm vào ngành công nghiệp trí tuệ nhân tạo của Trung Quốc. Việc xây dựng mô hình ngôn ngữ lớn tiên tiến yêu cầu hàng ngàn vi mạch máy tính chuyên biệt. Hiện tại, Baidu có thể phải dựa vào các vi mạch ít mạnh mẽ hơn, bao gồm cả các loại được thiết kế và sản xuất tại Trung Quốc. Nhưng khi tiến bộ vi mạch tiếp tục, Baidu và các công ty Trung Quốc khác có thể gặp khó khăn để theo kịp với quy mô và sức mạnh mà các công ty Mỹ có thể áp dụng vào các dự án chatbot.
Li của Baidu đã thừa nhận những căng thẳng giữa Mỹ và Trung Quốc trong video ra mắt Ernie Bot nhưng giảm bớt chúng. "Ernie không phải là một công cụ trong cuộc đua công nghệ Mỹ-Trung Quốc,” ông nói, “nhưng là kết quả tự nhiên của các thế hệ nhà phát triển Baidu theo đuổi ước mơ sử dụng công nghệ để thay đổi thế giới." Ngay cả khi Baidu có thể vượt qua những thách thức phía trước, so sánh với ChatGPT dường như không thể tránh khỏi.
