Theo nhận định của nhà đồng sáng lập Ethereum, GPT-4 của OpenAI đã vượt qua bài kiểm tra Turing, một mô hình trí tuệ nhân tạo tổng quát (AGI)
Bài kiểm tra Turing là một tiêu chuẩn không rõ ràng dành cho các hệ thống AI để đánh giá mức độ giống con người trong việc tương tác ngôn ngữ tự nhiên. Được đặt tên theo nhà toán học Alan Turing vào năm 1950.
Theo Turing, vào thời điểm đó, một hệ thống AI có khả năng phát sinh văn bản mà khiến con người tin rằng họ đang nói chuyện với một con người khác sẽ cho thấy khả năng 'suy nghĩ'.
Gần 75 năm sau, Vitalik Buterin đã chia sẻ diễn giải của mình về nghiên cứu mới nhất từ Đại học California San Diego như là minh chứng cho việc một mô hình đối thoại cuối cùng đã vượt qua bài kiểm tra Turing.
Các nhà nghiên cứu tại Đại học California San Diego vừa công bố một bài báo tiền ấn bản có tựa đề “GPT-4 không thể phân biệt được với con người trong bài kiểm tra Turing.” Theo đó, họ đã tiến hành một thử nghiệm mù cho khoảng 500 người để xác định khả năng phân biệt giữa con người và các mô hình AI.
Nghiên cứu chỉ ra rằng trong 56% thời gian, con người đã nhầm lẫn GPT-4 là “con người”. Điều này chứng tỏ GPT-4 đã thành công trong việc đánh lừa con người.
Quan điểm của Vitalik Buterin
Theo Buterin, một hệ thống AI chỉ cần đánh lừa được hơn một nửa số người mà nó tương tác để vượt qua bài kiểm tra Turing.
Buterin cũng nhấn mạnh:
“Điều đó có nghĩa là khả năng của con người để nhận diện xem đó là con người hay bot về cơ bản giống như việc tung đồng xu!”
Buterin đã giải thích thêm rằng, “Ok, không hoàn toàn, vì con người được nhận diện là con người 66% thời gian so với 54% cho bot, nhưng sự chênh lệch 12% là rất nhỏ; trong bất kỳ bối cảnh thực tế nào điều đó về cơ bản cũng được coi là vượt qua.”
Ông cũng bổ sung sau đó, phản hồi các bình luận về nhận định ban đầu của mình rằng bài kiểm tra Turing là “cột mốc nổi tiếng nhất và được xã hội chấp nhận nhiều nhất cho việc ‘AI là vấn đề nghiêm trọng ngay bây giờ’. Vì vậy, thật tốt để nhắc nhở bản thân rằng cột mốc này đã được vượt qua.”
Bài kiểm tra Turing
Trí tuệ nhân tạo tổng quát (AGI) và bài kiểm tra Turing không cần thiết phải liên quan đến nhau, mặc dù thường bị nhầm lẫn. Turing đã xây dựng bài kiểm tra của mình dựa trên toán học và dự đoán một tình huống nơi AI có thể đánh lừa con người nghĩ rằng nó là một trong số họ thông qua cuộc trò chuyện.
Cần lưu ý rằng bài kiểm tra Turing là một cấu trúc thoáng qua không có tiêu chuẩn thực sự hoặc cơ sở kỹ thuật. Không có sự đồng thuận khoa học về việc liệu máy có khả năng “suy nghĩ” như sinh vật sống hay không hoặc về cách đo lường kỳ công đó. Đơn giản, AGI hoặc khả năng “suy nghĩ” của một AI hiện không thể đo lường hoặc định nghĩa bởi các cộng đồng khoa học hoặc kỹ thuật.
Turing đã đưa ra các ý tưởng của mình từ lâu trước khi các hệ thống trí tuệ nhân tạo dựa trên token và sự xuất hiện của các mạng đối kháng sinh, tiền đề của các hệ thống AI sinh sinh ngày nay.
Trí tuệ nhân tạo tổng quát
Phức tạp hơn là ý tưởng về AGI, thường được kết nối với bài kiểm tra Turing. Trong ngôn ngữ khoa học, một “trí tuệ tổng quát” là một trí tuệ có khả năng thực hiện bất kỳ công việc trí tuệ nào. Điều này loại trừ con người, vì không ai có khả năng “tổng quát” trên toàn bộ phạm vi hoạt động trí tuệ của con người. Vì vậy, một “trí tuệ nhân tạo tổng quát” sẽ có khả năng suy nghĩ vượt xa bất kỳ con người nào đã biết.
Nói như vậy, rõ ràng GPT-4 không đáp ứng đúng tiêu chuẩn của “trí tuệ tổng quát” theo nghĩa khoa học chặt chẽ. Nhưng điều này không cản trở những người trong cộng đồng AI sử dụng thuật ngữ “AGI” để chỉ mọi hệ thống AI có khả năng đánh lừa một số lượng lớn con người.
Trong văn hóa hiện nay, việc sử dụng các thuật ngữ và cụm từ như “AGI”, “giống con người”, và “vượt qua bài kiểm tra Turing” để ám chỉ mọi hệ thống AI tạo ra nội dung tương đương với nội dung do con người tạo ra là rất phổ biến.
Theo Cointelegraph