Công cụ tìm kiếm Google, nổi tiếng với độ chính xác cao, đang gặp phải tranh cãi khi tích hợp trí tuệ nhân tạo (AI) dẫn đến những câu trả lời sai lệch và không hợp lý.
Tính năng Google AI Overview, được xem là một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo, đã gây thất vọng ngay từ khi ra mắt vào ngày 15/5 vừa qua. Nguyên nhân chính là do công cụ này liên tục đưa ra những câu trả lời không chính xác, thậm chí là không hợp lý, khiến người dùng nghi ngờ về hiệu suất của AI trong việc cải thiện trải nghiệm tìm kiếm.
Một ví dụ điển hình là khi một người dùng tìm kiếm giải pháp cho việc 'phô mai và bánh pizza không bị dán vào nhau', công cụ AI của Google lại đưa ra lời khuyên 'thêm 1/8 cốc keo không độc hại vào nước sốt để tăng độ kết dính'. Một ví dụ khác là khi được hỏi 'Có con thỏ nào từng thi đấu ở giải bóng rổ NBA không', công cụ này đã trả lời 'Có' do nhầm lẫn giữa từ 'thỏ' với tên của một cầu thủ. Đối diện với làn sóng chỉ trích, Google đã thừa nhận những 'ảo giác' này là hạn chế của Mô hình Ngôn ngữ Lớn (LLM) - công nghệ cốt lõi của AI Overview. Họ cũng cam kết sẽ tiếp tục cải thiện thuật toán để khắc phục tình trạng này.
Tuy nhiên, theo ông Sundar Pichai - CEO của Google, những 'ảo giác' này là hạn chế của Mô hình Ngôn ngữ Lớn (LLM). LLM là công nghệ cốt lõi của tính năng AI Overview và việc Google thừa nhận hạn chế này cho thấy họ có thể đã quá vội vàng khi ra mắt sản phẩm mà chưa hoàn thiện. Quan điểm này cũng được nhiều chuyên gia công nghệ đồng tình.
Theo họ, người dùng có thể dễ dàng bỏ qua những câu trả lời 'ngớ ngẩn' của ChatGPT vì mục đích giải trí. Tuy nhiên, với một công cụ tìm kiếm uy tín như Google, người dùng có quyền đòi hỏi sự chính xác và đáng tin cậy. Việc Google AI Overview liên tục mắc lỗi 'không hợp lý' cho thấy Google có thể đã quá vội vàng trong việc ra mắt sản phẩm để cạnh tranh với các đối thủ như Bing AI hay ChatGPT.
Nguyên nhân sâu xa dẫn đến những câu trả lời không chính xác của Google AI được cho là do quá trình huấn luyện AI dựa trên nguồn dữ liệu khổng lồ nhưng chưa được xử lý kỹ lưỡng. Ông Hồ Thiệu Dũng - Đồng sáng lập kiêm Giám đốc Công nghệ (CTO) của Công ty An ninh mạng Quan An (Trung Quốc) - cho biết: 'Do con người đặt ra những câu hỏi rất đa dạng và phóng khoáng, AI sẽ cung cấp câu trả lời dựa trên xác suất thống kê gần nhất chứ không phải câu trả lời chính xác. Trong trường hợp này, câu trả lời của AI dù nghe có vẻ hợp lý nhưng có thể không đúng với thực tế. Vì vậy, việc làm sạch dữ liệu là khâu quan trọng để tránh lan truyền thông tin không chính xác'.
Vào ngày 21/2 năm nay, Google công bố hợp tác với Reddit – một mạng xã hội thường được so sánh với 'diễn đàn Reddit của Mỹ' – để sử dụng nội dung trên nền tảng này để huấn luyện mô hình AI.
Theo ông Trần Hi – Phó Tổng thư ký Ủy ban Tiêu chuẩn hóa Trí tuệ Nhân tạo Thượng Hải, Trưởng ban Nghiên cứu Tiêu chuẩn của Hiệp hội Công nghiệp Trí tuệ Nhân tạo Thượng Hải – Reddit có nhiều chủ đề đa dạng nhưng cũng chứa đựng nhiều thông tin không chính xác và rối loạn, ví dụ như những câu trả lời ‘bá đạo’ của người dùng.
Nếu không được làm sạch và lọc kỹ càng, mô hình AI được huấn luyện có thể dễ bị ‘nhiễu’ bởi những thông tin sai lệch này'. Ông Trần Hi cũng cho biết, Google AI có thể đã sử dụng kỹ thuật Tìm kiếm tăng cường tạo văn bản (RAG) và ưu tiên một số trang web cụ thể. Theo đó, Reddit – là đối tác – được ưu tiên trong việc thu thập và tổng hợp câu trả lời từ cơ sở kiến thức, sau đó được xử lý bởi mô hình ngôn ngữ lớn. Điều này dẫn đến việc những câu trả lời mang tính chất đùa cợt, như 'bôi keo vào bánh pizza', lọt vào hệ thống.
Có thể thấy Google đang phải đối mặt với áp lực cạnh tranh từ các đối thủ như Bing (với trợ lý AI 'Bing thông minh' ra mắt từ năm 2019) và OpenAI (với mô hình GPT-4o ra mắt vào ngày 14/5).
Bên cạnh đó, thay đổi thói quen của người dùng, đặc biệt là giới trẻ, khi họ chuyển sang các nền tảng mới như TikTok cũng là một thách thức lớn. Trong bối cảnh đó, việc tích hợp AI vào công cụ tìm kiếm được coi là nỗ lực của Google nhằm thu hút người dùng, duy trì vị thế dẫn đầu trong kỷ nguyên AI. Tuy nhiên, sự cố lần này lại cho thấy Google cần phải cẩn thận hơn trong việc phát triển và triển khai các sản phẩm AI. Việc ra mắt sản phẩm chưa hoàn thiện một cách vội vã không chỉ không giúp Google giành lại thị phần mà còn có thể ảnh hưởng tiêu cực đến uy tín của hãng.