Tất cả các chatbot và mô hình trí tuệ nhân tạo mới đều phải đối mặt với vấn đề của hiện tượng 'ảo giác AI' này.
Vào ngày 30/11/2022, chatbot AI mang tên ChatGPT đã chính thức ra mắt, làm rung chuyển cả ngành công nghệ.
Người dùng hào hứng với công nghệ mới, đặt hàng ngàn câu hỏi phức tạp và ChatGPT đã nhanh chóng đưa ra câu trả lời.
ChatGPT, giống như nhiều chatbot khác, gặp phải vấn đề của hiện tượng 'ảo giác', khi gặp khó khăn trong việc hiểu biết và đưa ra kết quả chính xác.
Hệ thống tự động cũng có thể gặp phải hiện tượng 'ảo giác'
Hiện tượng ảo giác, hay còn được gọi là bịa chuyện, xảy ra khi một mô hình trí tuệ nhân tạo tạo ra kết quả không chính xác hoặc gây hiểu nhầm.
Ví dụ về hiện tượng ảo giác trong trí tuệ nhân tạo, cụ thể là ứng dụng ChatGPT sử dụng mô hình ngôn ngữ lớn để tạo ra văn bản.
Theo giáo sư Ahmed Banafa, chuyên gia về AI và Internet Vạn vật, ChatGPT có thể tạo ra kết quả không ngờ và không thể dự đoán do dữ liệu đầu vào không chuẩn.
Các chuyên gia tại OpenAI tiếp tục cải thiện dữ liệu đầu vào để ChatGPT trở nên hoàn thiện hơn. Phiên bản mới nhất của ChatGPT đã sử dụng mô hình ngôn ngữ lớn GPT-4, với hiệu suất và độ chính xác cao hơn so với phiên bản trước, tuy vẫn còn tồn tại hiện tượng ảo giác.
Không chỉ riêng ChatGPT, các mô hình ngôn ngữ lớn khác của các tập đoàn công nghệ hàng đầu đều phải đối mặt với hiện tượng ảo giác của trí tuệ nhân tạo.
Từ truy vấn sai, chatbot Bard của Google cũng tự tin tạo ra câu trả lời thuyết phục nhưng không chính xác.
Nguyên nhân và các phương pháp khắc phục hiện tại
Nhận định chung cho thấy dữ liệu đầu vào không chuẩn là nguyên nhân chính dẫn đến hiện tượng ảo giác AI. Các hệ thống AI cũng có thể tự động tạo ra những kết quả không chính xác dựa trên dữ liệu đã học và truy vấn người dùng.
Tuy vậy, không phải lỗi lầm hoàn toàn do máy móc vô tri. Có thể nguyên nhân từ các truy vấn của người dùng đưa vào, khiến trí tuệ nhân tạo bịa chuyện; hoặc các truy vấn này vượt ra ngoài cơ sở dữ liệu, khiến AI phải... tự tìm cách để đưa ra kết quả hợp lý, hoặc người dùng cố ý sử dụng các prompt lạc quan để vượt qua hệ thống kiểm duyệt và kích thích AI sản sinh kết quả không chính xác.
Người dùng đặt câu hỏi cho Bard về ChatGPT.
Tiến sĩ Đặng Trần Thái, Trưởng phòng Xử lý ngôn ngữ tự nhiên tại công ty VinBigdata, nhận định: “Các nhà phát triển hiện nay chỉ có thể cố gắng để giảm thiểu tính ảo giác của các mô hình ngôn ngữ lớn thay vì loại bỏ hoàn toàn do tính xác suất thống kê của mô hình”.
Theo Tiến sĩ, có hai yếu tố giúp mô hình ngôn ngữ lớn tránh được việc bịa chuyện là: khả năng ghi nhớ và phân biệt tri thức, và khả năng hiểu rõ câu hỏi, chỉ dẫn của người dùng.
Đoạn dưới được trích nguyên văn từ bài giải thích của Tiến sĩ Đặng Trần Thái, được đăng trên trang cá nhân của anh.
Trong quá trình huấn luyện mô hình ngôn ngữ, chúng ta đang dạy cho mô hình “nhớ” các thực thể (như tên người, địa điểm, sự kiện, v.v.) và mối quan hệ giữa chúng thông qua các câu chữ trong văn bản huấn luyện mô hình. Các thực thể và mối quan hệ giữa chúng được gọi là tri thức.
Ví dụ, khi ta đưa câu “Kim Lân là tác giả của tác phẩm Vợ nhặt” vào huấn luyện mô hình ngôn ngữ, mô hình được dạy rằng “Kim Lân” và “tác phẩm Vợ nhặt” có mối quan hệ với nhau vì chúng cùng xuất hiện trong một câu. Mối quan hệ giữa hai thực thể này là “A là tác giả của B”. Mức độ mạnh yếu của mối quan hệ này phụ thuộc vào tần suất xuất hiện của nó trong dữ liệu huấn luyện. Đó là cách mô hình học tri thức từ các văn bản huấn luyện.
Ngoài khả năng ghi nhớ, mô hình ngôn ngữ còn cần phải phân biệt thông tin và tri thức trong dữ liệu. Ví dụ, trong dữ liệu có thông tin “Tác phẩm Số đỏ của Vũ Trọng Phụng”, mô hình cũng cần phải phân biệt thông tin về tác phẩm và tác giả để không nhầm lẫn về tác giả của “Vợ nhặt” là “Vũ Trọng Phụng”.
Mô hình ngôn ngữ cũng cần phải phân biệt các thông tin chứa trong câu hỏi và chỉ dẫn của người dùng. Ví dụ, khi người dùng hỏi “tác giả của vợ nhặt là ai?”, thông tin chính giúp hệ thống đưa ra câu trả lời chính xác nằm ở các cụm từ “tác giả” và “tác phẩm vợ nhặt”. Mô hình cần phải hiểu và phân biệt tác phẩm “vợ nhặt” với các tác phẩm khác và dựa trên khả năng ghi nhớ tri thức để tránh đưa ra những câu trả lời “ngớ ngẩn” như “Tác giả của Vợ nhặt là Vũ Trọng Phụng”.
Có những lợi ích bất ngờ từ ảo giác của trí tuệ nhân tạo
Bịa đặt không thường được người ta đánh giá cao, trừ khi hành động 'bịa' đạt tới mức 'sáng tạo'. Các kiệt tác văn học và những bài hát bất tử theo thời gian đều là kết quả của sức sáng tạo.
Tương tự, trong một số trường hợp, hiện tượng ảo giác AI có thể kích thích tiềm năng sáng tạo trong nhiều lĩnh vực, bao gồm:
Thiết kế và nghệ thuật sáng tạo
Hiện tượng ảo giác AI có thể hỗ trợ các chuyên gia đồ họa, nghệ sĩ, giúp họ tạo ra những hình ảnh vượt ra ngoài khả năng tưởng tượng của con người. Sử dụng công nghệ AI, nghệ sĩ có thể tạo ra các phong cách nghệ thuật độc đáo và thú vị.
Thậm chí thông qua hiện tượng ảo giác, các hệ thống AI sinh chữ cũng có thể tạo ra những nội dung sáng tạo. Thực tế, một tác phẩm khoa học viễn tưởng do AI sáng tác đã giành giải thưởng văn học tại Trung Quốc.
Bức tranh có tên “Théâtre D'opéra Spatial”, được dịch là “Không gian Nhà hát Thính phòng”, đã giành giải nhất trong hạng mục “tranh kỹ thuật số” của một cuộc thi tại Mỹ.
Biểu đồ hóa dữ liệu
AI có khả năng tổ chức dữ liệu bằng cách phát hiện ra các mối liên kết mới, mở ra một góc nhìn mới đối với các bộ dữ liệu lớn. Hiệu quả của điều này có thể thấy rõ trong lĩnh vực tài chính, khi nó có thể phân tích xu hướng thị trường, giúp người dùng đưa ra quyết định và quản lý rủi ro.
Ngành game và ứng dụng thực tế ảo (VR)
Ảo giác AI có thể nâng cao trải nghiệm trò chơi cho người chơi. Thông qua việc tạo ra các môi trường ảo, nhà phát triển có thể tạo ra những thế giới ảo sống động, thú vị, nâng cao trải nghiệm của game thủ.
Kết luận
Con người đang đối mặt với ranh giới mờ nhạt giữa thực và ảo, và cần có sự sáng suốt hơn bao giờ hết để bảo vệ các giá trị cốt lõi, tuân thủ nguyên tắc đạo đức. Bên cạnh việc bổ sung dữ liệu huấn luyện cho AI và kiểm tra nội dung được tạo ra, người dùng cũng cần có trách nhiệm trong việc nhập truy vấn, đối chiếu kết quả với các nguồn tin cậy.
Dù danh sách lợi ích của AI ngày càng dài - thậm chí cả hiện tượng ảo giác AI cũng mang lại nhiều lợi ích bất ngờ - chúng ta không thể phớt lờ những nguy cơ, đặc biệt là khi công nghệ AI rơi vào tay bất kỳ ai có kiến thức về máy tính.
Xu hướng phát triển trí tuệ nhân tạo, đặc biệt là chatbot, vẫn đang tiếp tục. Hôm nay, VinBigdata sẽ giới thiệu công cụ chatbot do Việt Nam sản xuất, mang tên ViGPT. Chatbot này, được huấn luyện trên dữ liệu tiếng Việt, sẽ là một công cụ quan trọng cho người dùng, nhưng cũng đồng thời đặt ra nhiều thách thức cho cộng đồng và VinBigdata.
Giao diện của ViGPT.
Dự kiến ViGPT cũng sẽ có những ưu và nhược điểm tương tự như các chatbot khác của các tập đoàn công nghệ hàng đầu trên thế giới. Như bất kỳ sản phẩm công nghệ nào khác: mọi thứ sẽ được cập nhật theo thời gian, và chất lượng sản phẩm sẽ được cải thiện dần theo thời gian.
Hiện tại, bạn có thể đăng ký sử dụng thử ViGPT tại đường link https://landing.vigpt.vinbigdata.com/.