Một công cụ tìm kiếm mà bạn có thể trò chuyện sẽ giúp bạn tìm câu trả lời dễ dàng hơn - miễn là nó không nói ra những điều không có thật - đang khiến cả Microsoft, Google, Baidu, Alibaba và các công ty khác lao vào nghiên cứu và phát triển.
Jiang Chen, một chuyên gia máy học từng làm việc tại Google, đã bị cuốn hút khi sử dụng ChatGPT lần đầu. Chatbot này có vẻ mạch lạc trong các câu trả lời và chứa đầy đủ thông tin để giải đáp bất kỳ câu hỏi nào.
Tuy nhiên, ánh sáng rực rỡ của công nghệ này đã mờ đi khi Chen cố gắng sử dụng cùng một công nghệ cơ bản tạo ra ChatGPT để xây dựng một công cụ tìm kiếm tốt hơn cho Moveworks - công ty khởi nghiệp mà anh đồng sáng lập. Công ty muốn sử dụng AI để hỗ trợ nhân viên trong việc sàng lọc thông tin như tài liệu hỗ trợ kỹ thuật và trang nhân sự.
Kết quả cho thấy công cụ tìm kiếm AI mới của Chen rất xuất sắc trong việc thu thập tất cả các loại thông tin hữu ích từ tài liệu được cung cấp, bao gồm cả địa chỉ và số điện thoại. Nhưng vấn đề là một số trong số đó không thực sự tồn tại. “Khả năng tự tạo ra của nó thực sự đáng ngạc nhiên”, Chen nói.

ChatGPT có thể tạo ra những câu trả lời hơi quá mức sáng tạo. Ảnh từ internet
Trong khi đó, trên internet, sự phấn khích vô cùng về ChatGPT đang lan truyền và không có gì quá ngạc nhiên khi nhiều quan điểm cho rằng nó có thể đánh bại các công cụ tìm kiếm hiện tại. Rõ ràng, chatbot này có khả năng cung cấp các câu trả lời phức tạp cho các câu hỏi bằng cách tổng hợp thông tin từ hàng tỷ từ trên mạng internet.
Tuy nhiên, cách hoạt động cơ bản của nó lại đi ngược với ý tưởng về một công cụ tìm kiếm có thể truy xuất thông tin trên mạng một cách đáng tin cậy. Trên web có rất nhiều thông tin không chính xác, nhưng ChatGPT không nhận ra điều này, thậm chí sau đó còn sử dụng nó để tạo ra những thông tin sai lạc mới. Thuật toán AI cơ bản không thu thập thông tin trực tiếp từ cơ sở dữ liệu của sự kiện hoặc liên kết, mà thay vào đó chỉ tạo ra các chuỗi từ với mục đích thống kê sao cho tương tự với những gì được thấy trong dữ liệu đào tạo của nó. Và dĩ nhiên, nó không quan tâm đến sự thật.
Bất chấp thách thức đó, và có lẽ được thúc đẩy bởi sự hào hứng xung quanh ChatGPT, những gigants về tìm kiếm trên web, cũng như một số công ty mới thành lập, đang đẩy mạnh tiến lên. Microsoft, công ty đã đầu tư khoảng 10 tỷ USD vào OpenAI, đơn vị tạo ra ChatGPT, được cho là sẽ tích hợp công nghệ này vào công cụ tìm kiếm của mình là Bing.
Google, đã lặng lẽ làm việc trên một chatbot tương tự có tên LaMDA, được cho là đang cố gắng đưa ra phản hồi với Microsoft. Công ty có kế hoạch sớm phát hành một chatbot AI và có thể giới thiệu tới 20 sản phẩm tương tự trong năm nay.
Ở bên kia biển, các công ty Trung Quốc cũng muốn có hệ thống ngôn ngữ tự nhiên và thông minh của riêng mình vì nhiều lý do từ ngôn ngữ đến chính trị. Và việc tạo ra một ChatGPT bản địa chắc chắn sẽ đặt áp lực lên vai những gigants công nghệ của đất nước này.
Sau khi ra mắt công cụ sáng tác nghệ thuật theo phong cách Stable Diffusion, Baidu gần đây đã thông báo rằng họ đang làm việc trên chatbot AI có tên Ernie, dự kiến sẽ ra mắt vào tháng 3. Còn tập đoàn thương mại điện tử Alibaba sau đó cũng đã tiết lộ rằng “câu trả lời” của họ cho ChatGPT đang được thử nghiệm nội bộ. Công ty mẹ của WeChat, Tencent, cho biết họ đang tiến hành các “nghiên cứu có liên quan”.

Toàn bộ cộng đồng công nghệ đang mong chờ ChatGPT có thể đánh bại các công cụ tìm kiếm truyền thống. Ảnh từ Internet
Trong khi đó, một số công ty khởi nghiệp đã nhanh nhạy tung ra các công cụ tìm kiếm có giao diện trò chuyện tương tự như ChatGPT. Chúng bao gồm You.com, Perplexity AI và Neeva .
Những công cụ này đã thể hiện cả tiềm năng và thách thức của việc điều chỉnh công nghệ dạng ChatGPT để áp dụng vào tìm kiếm. You.com, do Richard Socher sáng lập, một chuyên gia về ngôn ngữ và trí tuệ nhân tạo, có khả năng cung cấp câu trả lời thông qua giao diện trò chuyện. Các câu trả lời sẽ đi kèm với các trích dẫn, giúp người dùng theo dõi nguồn gốc của thông tin.
Tuy nhiên, mô hình này đôi khi kết hợp các nguồn không liên quan. Ví dụ, khi bạn hỏi về một người cụ thể, câu trả lời có thể được tạo ra bằng cách kết hợp thông tin từ tiểu sử của nhiều người khác nhau có cùng tên.
Một vấn đề khác với một hệ thống như ChatGPT là các phản hồi của nó chỉ dựa trên dữ liệu mà nó đã được đào tạo. Việc đào tạo lại toàn bộ mô hình có thể tốn hàng triệu USD vì kích thước và quy mô dữ liệu của nó. Đó là lý do YouChat hoang mang khi được hỏi về tỷ số thể thao mới nhất nhưng lại biết thời tiết ở New York hiện tại như thế nào. Socher không muốn tiết lộ cách kết hợp các thông tin, xem đó là một lợi thế cạnh tranh.
“Tôi nghĩ hiện nay rất nhiều giao diện trò chuyện này vượt trội hơn nhiều so với trải nghiệm sử dụng công cụ tìm kiếm ở một số khía cạnh, nhưng ở những khía cạnh khác, chúng rõ ràng vẫn còn tệ hơn nhiều”, Socher thừa nhận. “Chúng tôi đang làm việc để giảm thiểu tất cả những vấn đề này.”

You.com là một công cụ tìm kiếm tích hợp chatbot kiểu ChatGPT, nhưng đừng kỳ vọng quá nhiều vào các câu trả lời của nó.
Aravind Srinivas, người sáng lập kiêm CEO của công ty khởi nghiệp Perplexity AI, người trước đây đã làm việc tại OpenAI, cho biết thách thức để tạo ra một hệ thống giống như ChatGPT với dữ liệu gần đây là cần phải kết hợp với một yếu tố khác. Ông nói: “Một mình chúng sẽ không bao giờ có thể trở thành công cụ tìm kiếm tốt.”
Saam Motamedi, một nhà đầu tư mạo hiểm tại Greylock Partners, người đã đầu tư vào công ty tìm kiếm dựa trên trí tuệ nhân tạo Neeva, cho biết ông vẫn chưa rõ các giao diện trò chuyện sẽ tương thích như thế nào với mô hình doanh thu chính cho các công cụ tìm kiếm, cụ thể là quảng cáo. Google và Bing sử dụng truy vấn tìm kiếm để chọn quảng cáo xuất hiện trên đầu danh sách các liên kết được cung cấp để phản hồi. Nhưng Motamedi nghi ngờ rằng các hình thức quảng cáo mới có thể cần phải xuất hiện để các giao diện tìm kiếm kiểu trò chuyện trở nên khả thi, nhưng ông hoàn toàn không rõ những hình thức đó sẽ là gì. Neeva hiện tính phí đăng ký cho các tìm kiếm không có quảng cáo không giới hạn.
Chi phí vận hành một mô hình như ChatGPT trên quy mô của Google cũng có thể gây ra vấn đề. Luis Ceze, đồng sáng lập và CEO của OctoML, ước tính rằng việc chạy một tìm kiếm trên ChatGPT có thể đắt gấp 10 lần so với tìm kiếm Google. Bởi vì mỗi câu trả lời sẽ yêu cầu chạy trên một mô hình quy mô lớn và hệ thống AI phức tạp.
Cơn sốt ChatGPT đã khiến một số lập trình viên và nhà nghiên cứu AI phải ngạc nhiên. Thuật toán cốt lõi của con bot này, được gọi là GPT, được OpenAI phát triển lần đầu tiên vào năm 2018 và một phiên bản mạnh mẽ hơn, GPT-2, đã được tiết lộ vào năm 2019 . Đó là một mô hình máy học được thiết kế để lấy văn bản và sau đó dự đoán điều gì sẽ xảy ra tiếp theo. Tuy nhiên, OpenAI đã cho thấy nó có thể hoạt động ấn tượng nếu được đào tạo với khối lượng văn bản khổng lồ. Phiên bản thương mại đầu tiên của công nghệ, GPT-3, đã có sẵn cho các nhà phát triển sử dụng kể từ tháng 6 năm 2020 và có thể thực hiện được nhiều điều mà ChatGPT đã thể hiện gần đây.
ChatGPT đã sử dụng phiên bản cải tiến của thuật toán cơ bản, nhưng bước nhảy vọt lớn nhất trong khả năng của nó đến từ việc OpenAI có đối tượng thử nghiệm là con người, những người sẽ cung cấp phản hồi cho hệ thống về điều gì tạo ra câu trả lời đủ để thỏa mãn họ. Nhưng giống như các hệ thống tạo văn bản trước đó, ChatGPT vẫn có xu hướng tái tạo các thông tin sai lệch từ dữ liệu đào tạo của nó, cũng như tạo ra các kết quả trông hợp lý nhưng thực tế lại không chính xác.

Ai đến đích sớm sẽ nhận được quả ngọt, nhưng nếu các chatbot AI quay ngược lại hủy hoại chính các công cụ tìm kiếm truyền thống thì sao? Ảnh internet
Gary Marcus, giáo sư danh dự tại Đại học New York và là người lên tiếng chỉ trích sự cường điệu của AI, tin rằng ChatGPT không phù hợp để tìm kiếm vì nó không hiểu thực sự về những gì nó nói. Ông nói thêm rằng các công cụ như ChatGPT có thể gây ra các vấn đề khác cho các công ty tìm kiếm bằng cách làm tràn ngập internet bằng các văn bản được tối ưu hóa cho công cụ tìm kiếm, do chính AI này tạo ra. Ông nói: “Tất cả các công cụ tìm kiếm sắp gặp sự cố.”
Alex Ratner, trợ lý giáo sư tại Đại học Washington và là người đồng sáng lập Snorkel AI, gọi ChatGPT là “một bước ngoặt hợp pháp” cho những gì mà một phần mềm có thể làm. Nhưng ông cũng nói rằng có thể mất một thời gian để tìm ra cách ngăn chặn các mô hình ngôn ngữ như GPT bịa đặt thông tin. Ông tin rằng việc tìm cách cập nhật thông tin mới cho nó để giữ cho nguồn tìm kiếm luôn mới mẻ rất có thể sẽ liên quan đến các phương pháp mới để đào tạo các mô hình AI cơ bản.
Nhưng những bản sửa lỗi đó sẽ mất bao lâu để xuất hiện vẫn chưa ai biết. Có thể sẽ mất một thời gian dài trước khi công nghệ này có thể thay đổi hoàn toàn cách mọi người tìm kiếm câu trả lời.
“Tôi đã nói với đội của tôi rằng mọi người sẽ nhận ra sự khác biệt giữa trước và sau khi có ChatGPT”, Chen từ Moveworks chia sẻ. “Nhưng liệu nó có thể thay thế các công cụ tìm kiếm hay không lại là một câu hỏi khác.”
Tham khảo Wired
