Mytour / Joules Garcia
Định nghĩa Kiểm tra Turing là gì?
Kiểm tra Turing là một phương pháp đơn giản nhưng rất tinh vi để xác định xem một máy có thể thể hiện trí tuệ con người: Nếu một máy có thể tham gia vào cuộc đối thoại với con người mà không bị nhận ra là máy, thì máy đó đã thể hiện trí tuệ con người.
Bài Kiểm tra Turing được đề xuất trong một bài báo được xuất bản vào năm 1950 bởi nhà toán học và tiên phong trong lĩnh vực máy tính Alan Turing. Nó đã trở thành một động lực cơ bản trong lý thuyết và phát triển Trí tuệ Nhân tạo (AI).
Những điểm chính cần nhớ
- Kiểm tra Turing đánh giá trí thông minh của một thí nghiệm để xác định xem một máy có thể thể hiện trí thông minh hay không.
- Theo kiểm tra này, một chương trình máy tính có thể nghĩ nếu những phản ứng của nó có thể đánh lừa một con người tin rằng nó cũng là con người.
- Không phải ai cũng chấp nhận sự hợp lệ của Kiểm tra Turing, nhưng vượt qua nó vẫn là một thử thách lớn đối với các nhà phát triển Trí tuệ Nhân tạo.
- Có nhiều biến thể của Kiểm tra Turing cũng như sự điều chỉnh cách tiếp cận trong các bài kiểm tra Trí tuệ Nhân tạo khác nhau.
- Kiểm tra Turing có một số hạn chế bao gồm yêu cầu môi trường kiểm soát, không có định nghĩa cụ thể về trí tuệ và cần phải thích nghi với sự tiến bộ công nghệ tiến hóa.
Hiểu về Kiểm tra Turing
Các tiến bộ nhanh chóng trong lĩnh vực máy tính hiện nay đã thể hiện rõ ràng trong nhiều khía cạnh của cuộc sống của chúng ta. Chúng ta có các chương trình dịch một ngôn ngữ sang ngôn ngữ khác chỉ trong nháy mắt, robot lau dọn cả một căn nhà trong vài phút, robot tài chính tạo ra các hồ sơ nghỉ hưu cá nhân hóa, và các thiết bị đeo được theo dõi sức khỏe và mức độ thể dục của chúng ta.
Tại vị trí hàng đầu của công nghệ đột phá là sự phát triển của trí tuệ nhân tạo và những hạn chế mà máy tính có thể gặp phải. Vì lý do này, Kiểm tra Turing được thiết kế để đánh giá xem một máy tính có thể 'thông minh' đủ để bị nhầm lẫn với một con người hay không. Các nhà phê bình của Kiểm tra Turing cho rằng có thể xây dựng một máy tính có khả năng suy nghĩ, nhưng không có khả năng có một tâm trí riêng của nó. Họ tin rằng sự phức tạp của quá trình tư duy con người không thể được mã hóa.
Kiểm tra được thực hiện trong một phòng thẩm vấn do một thẩm phán điều hành. Các thí nghiệm, một người và một chương trình máy tính, được giấu khỏi tầm nhìn. Thẩm phán có một cuộc đối thoại với cả hai bên và cố gắng xác định đâu là con người và đâu là máy tính, dựa trên chất lượng của cuộc đối thoại của họ. Turing kết luận rằng nếu thẩm phán không thể phân biệt được sự khác biệt, máy tính đã thành công trong việc thể hiện trí tuệ con người. Đó là, nó có thể suy nghĩ.
Lịch sử của Kiểm tra Turing
Alan Turing phát triển một số khái niệm cơ bản của khoa học máy tính trong khi tìm kiếm một phương pháp hiệu quả hơn để phá các tin nhắn bị mã hóa của Đức trong Thế chiến II. Sau chiến tranh, ông bắt đầu suy nghĩ về trí tuệ nhân tạo. Trong bài báo năm 1950 của mình, Turing bắt đầu bằng việc đặt câu hỏi, 'Máy có thể nghĩ được không?' Sau đó ông đề xuất một bài kiểm tra nhằm giúp con người trả lời câu hỏi này.
Một số máy tính sớm đã có những khẳng định sớm về khả năng đánh lừa con người trong các tình huống rất cơ bản. Năm 1966, Joseph Weizenbaum tạo ra ELIZA, một máy tính có khả năng chuyển đổi từng từ cụ thể thành các câu hoàn chỉnh. ELIZA là một trong những máy tính sớm nhất có khả năng đánh lừa người thử nghiệm rằng nó là con người.
Chưa đầy một thập kỷ sau đó, một chatbot có tên là PARRY được mô phỏng để bắt chước hành vi của một người bị rối loạn hoang tưởng. Một nhóm bác sĩ tâm thần đã được yêu cầu phân tích các cuộc đối thoại với bệnh nhân thực và các cuộc đối thoại với PARRY. Khi được hỏi để xác định những bản ghi âm nào là các chương trình máy tính, nhóm chỉ có thể xác định máy tính 48% trong số các trường hợp. Các nhà phê bình của cả ELIZA và PARRY đều cho rằng không đạt đủ các quy tắc của Kiểm tra Turing và không chỉ ra được trí tuệ máy đầy đủ.
Một chatbot có tên là Eugene Goostman được một số người chấp nhận là người đầu tiên vượt qua Kiểm tra Turing vào năm 2014.
Kiểm tra Turing ngày nay
Kiểm tra Turing vẫn có những người phản đối, nhưng nó vẫn là một thước đo thành công của các dự án trí tuệ nhân tạo. Phiên bản cập nhật của Kiểm tra Turing có nhiều hơn một thẩm phán con người thẩm vấn và trò chuyện với cả hai thí nghiệm. Dự án được coi là thành công nếu hơn 30% thẩm phán, sau năm phút trò chuyện, kết luận rằng máy tính là con người.
Giải thưởng Loebner là một cuộc thi Kiểm tra Turing hàng năm được khởi động vào năm 1991 bởi Hugh Loebner, một nhà phát minh và nhà hoạt động Mỹ. Loebner đã tạo ra các quy tắc bổ sung yêu cầu con người và chương trình máy tính phải có cuộc đối thoại trong 25 phút với mỗi trong bốn thẩm phán. Người chiến thắng là máy tính mà chương trình của nó nhận được nhiều phiếu bầu và xếp hạng cao nhất từ các thẩm phán.
Năm 2014, Kevin Warwick của Đại học Reading tổ chức một cuộc thi Kiểm tra Turing để kỷ niệm 60 năm ngày mất của Alan Turing. Một chatbot máy tính có tên là Eugene Goostman, với nhân vật của một cậu bé 13 tuổi, đã vượt qua Kiểm tra Turing kỹ thuật trong sự kiện đó. Anh đã giành được phiếu bầu của 33% thẩm phán, người tin rằng anh ta là con người.
Năm 2018, Google Duplex đã tiết lộ khả năng thực hiện các nhiệm vụ qua điện thoại. Trong các trình diễn khác nhau, Duplex đã đặt lịch hẹn cắt tóc cũng như gọi điện đến một nhà hàng, với con người ở đầu dây bên kia không nhận ra họ đang tương tác với một máy. Tuy nhiên, các nhà phê bình chỉ ra rằng sự tương tác này không phù hợp với Kiểm tra Turing thực sự và cho rằng Kiểm tra vẫn chưa bị đánh bại bởi một máy.
Các phiên bản Kiểm tra Turing
Có một số biến thể của Kiểm tra Turing, tất cả đều có cùng mục đích là phát hiện xem một người tham gia có phải là con người hay là máy. Mỗi biến thể sẽ tiếp cận khác nhau trong việc đặt câu hỏi và đánh giá các phản ứng của người tham gia.
Trò chơi bắng nhắng
Một trong những ứng dụng sớm của Kiểm tra Turing, phiên bản trò chơi bắng nhắng thường sử dụng ba bên. Người đầu tiên là nam giới, người thứ hai là nữ giới, và người thứ ba có trách nhiệm xác định giới tính của hai người đầu tiên. Người đầu tiên thường được giao nhiệm vụ cố gắng lừa gạt người thứ ba, trong khi người thứ hai thường được giao nhiệm vụ giúp người thứ ba xác định chính xác mỗi giới tính.
Các phiên bản tiếp theo của trò chơi bắng nhắng đã tiến hóa thành cả hai bên cố gắng lừa gạt người thứ ba để xác định sai các giới tính. Dù sao, mục tiêu của trò chơi bắng nhắng là xác định liệu một người thẩm vấn có thể bị lừa gạt hay không.
Phiên bản Đánh giá Chuẩn
Một phiên bản phổ biến khác của Kiểm tra Turing không cố gắng xem liệu một máy tính có thể bị lừa gạt hay không mà thay vào đó là xem liệu một máy tính có thể bắng nhắng một con người hay không. Trong biến thể đánh giá chuẩn của Kiểm tra Turing, người đầu tiên là một máy tính và người thứ hai là một con người thuộc bất kỳ giới tính nào.
Trong biến thể này, người thứ ba cố gắng phát hiện xem người nào trong hai người đầu tiên là con người và người nào là máy tính. Người thẩm vấn không phải là đối tượng được kiểm tra; thay vào đó, đó là máy tính đang cố gắng lừa gạt con người (không phải hướng ngược lại trong trò chơi bắng nhắng). Ví dụ, có thể được hỏi một loạt các câu hỏi về tài chính cá nhân để xác định liệu các phản ứng của nó có được mong đợi một cách hợp lý trong tài chính hành vi hay không.
Câu chuyện hư cấu Voight-Kampff trong loạt phim khoa học viễn tưởng thời kỳ hậu tận thế Blade Runner là một lối chơi trên ý tưởng kiểm tra một máy tính cho hành vi thông minh của nó.
Các phương pháp hiện đại đối với Kiểm tra Turing
Kể từ khi Kiểm tra Turing được tạo ra, các phương pháp hiện đại hơn đã tiến triển nhằm cố gắng phát hiện con người và máy tính tốt hơn. Những biến thể của Kiểm tra Turing này liên tục tiến hóa để duy trì tính phù hợp trong quá trình tiến bộ công nghệ.
- Kiểm tra Turing Đảo ngược nhằm mục đích để một con người lừa gạt một máy tính vào việc tin rằng nó không phải đang thẩm vấn một con người.
- Kiểm tra Turing Toàn diện tích hợp khả năng cảm nhận và khả năng của người được hỏi trong việc điều khiển các đối tượng.
- Kiểm tra Marcus cho phép các thí nghiệm xem các phương tiện truyền thông và đáp lại câu hỏi về nội dung tiêu thụ.
- Kiểm tra Lovelace 2.0 yêu cầu các thí nghiệm tạo ra nghệ thuật và kiểm tra khả năng của họ để làm điều đó.
- Kiểm tra Tín hiệu Thông minh Tối thiểu chỉ hỏi các thí nghiệm câu hỏi nhị phân (tức là chỉ cho phép câu trả lời đúng/sai hoặc có/không).
Hạn chế của Kiểm tra Turing
Có rất nhiều nhà phê bình của Kiểm tra Turing, và các biến thể trên cố gắng giảm thiểu một số hạn chế của Kiểm tra Turing gốc. Tuy nhiên, quan trọng là phải cẩn thận với những hạn chế của Kiểm tra Turing và những nơi mà phân tích của nó có thể không đủ sâu.
- Kiểm tra Turing yêu cầu môi trường rất được kiểm soát để thực hiện. Các thí nghiệm phải được giấu khỏi nhau trong suốt quá trình thử nghiệm, mặc dù các bên phải có một phương tiện giao tiếp đáng tin cậy.
- Kiểm tra Turing có thể không phù hợp để kiểm tra trí thông minh vì các hệ thống máy tính khác nhau có cấu trúc khác nhau. Do đó, có thể có các giới hạn tự nhiên, bẩm sinh đối với những gì mà một máy tính có thể thực hiện.
- Kiểm tra Turing đang tiến hóa; tuy nhiên, các tiến bộ công nghệ đang phát triển nhanh hơn. Cân nhắc đến Định luật Moore, mô tả sự phát triển nhanh chóng của khả năng xử lý với sự giảm nhanh chóng của chi phí. Khi máy tính có được nhiều khả năng hơn, các phương pháp kiểm tra lịch sử có thể không còn phù hợp khi máy tính có được nhiều khả năng giống con người hơn.
- Kiểm tra Turing đánh giá trí thông minh, mặc dù có thể không phải là một chỉ số phù hợp cho tất cả các loại trí thông minh. Ví dụ, một máy tính có thể thành công trong việc lừa gạt một người thẩm vấn dựa trên khả năng xử lý phản ứng tương tự như một con người. Tuy nhiên, điều này có thể không thực sự cho thấy trí tuệ cảm xúc hay nhận thức; có thể chỉ đơn giản là máy tính có một bộ mã lệnh rất có liên quan và có năng lực cao.
Làm thế nào để Kiểm tra Turing hoạt động?
Một Kiểm tra Turing hoạt động với một người thẩm vấn đặt cho một thí nghiệm một loạt câu hỏi. Mỗi bên được giữ trong một khu vực riêng biệt, vì vậy không có tiếp xúc vật lý được phép. Các câu trả lời được thí nghiệm cung cấp được đánh giá dựa trên việc liệu câu trả lời có phân biệt được giữa một người tham gia có thể đưa ra câu trả lời đó hay không.
Máy tính nào đã vượt qua Kiểm tra Turing?
Vào năm 2018, Google Duplex đã được giới thiệu tại Hội nghị phát triển thường niên Google I/O. Máy đã sắp xếp một cuộc hẹn tại salon và tương tác với trợ lý salon qua điện thoại là một phần của cuộc trò chuyện. Mặc dù một số nhà phê bình có quan điểm khác nhau về kết quả, một số tin rằng Google Duplex đã vượt qua Kiểm tra Turing.
Một Con Người Có Thể Thất Bại Trong Kiểm tra Turing?
Có. Mặc dù Kiểm tra Turing dựa trên kiến thức và trí thông minh, nó cũng đánh giá cách câu trả lời được cung cấp và liệu câu trả lời có được hiểu là cố ý hay không.
Ví dụ, hãy tưởng tượng bạn được hỏi cung cấp tổng của 43.219 và 87.878. Việc bạn có thể cung cấp câu trả lời chính xác hay không chỉ là một phần của bài kiểm tra; Kiểm tra Turing đánh giá thời gian mà bạn cung cấp câu trả lời, bất kỳ câu hỏi làm rõ nào bạn hỏi đáp lại, hoặc liệu bạn có hiểu để cộng và không phải là hai con số. Dựa trên các câu trả lời của con người, có thể xảy ra nhầm lẫn là một máy tính (tức là nếu bạn vô tình trừ thay vì cộng hai con số, đó có thể là bằng chứng tội phạm).
Có những Ví dụ về Các Câu Hỏi Kiểm tra Turing?
Một ví dụ thú vị về một câu hỏi tiềm năng trong Kiểm tra Turing có thể dựa trên ngôn ngữ và trò chơi từ. Ví dụ, một câu hỏi có thể hỏi 'sự khác biệt giữa thời gian bay và một chiếc máy bay bay là gì?' Mặc dù loại câu hỏi này có thể không công bằng với những người tham gia không quen thuộc với tiếng Anh, nó cũng là một ví dụ về khả năng phân biệt logic nơi một ví dụ đơn lẻ (tức là từ bay) có thể có nghĩa khác nhau trong các ngữ cảnh khác nhau.
Một ví dụ khác về câu hỏi Kiểm tra Turing thường là câu hỏi vô lý. Các câu hỏi như 'Sự khác biệt giữa bóng đá là người đánh và mặc mũ bảo hiểm?' ngữ pháp không chính xác và dễ dàng bị phát hiện bởi con người là không có ý nghĩa. Tuy nhiên, một máy có thể vẫn cố gắng phân tích một câu trả lời.
Điểm quan trọng
Kiểm tra Turing là một phương pháp để xác định xem một máy có thể thể hiện sự thông minh như con người hay không. Hiện nay có rất nhiều biến thể của Kiểm tra Turing, và khi công nghệ tiếp tục tiến bộ với AI đứng đầu, các dòng suy nghĩ mới đang nổi lên về cách xác định thông minh và rất nhiều sự khác biệt đang phát sinh từ suy nghĩ đó cũng cần phải làm việc nhiều hơn trong lĩnh vực này.