Sự hiểu biết thông thường là một điểm mù lớn đối với những người phát triển trí tuệ nhân tạo
Chào mừng bạn đến với đánh giá sách trí tuệ nhân tạo, một loạt bài viết khám phá về văn học mới nhất về trí tuệ nhân tạo.
Những tiến bộ gần đây trong học sâu đã làm dậy lên sự quan tâm về sự gần gũi của máy móc có thể nghĩ và hành động như con người, hay trí tuệ nhân tạo tổng quát. Theo con đường xây dựng các mạng nơ-ron lớn hơn và tốt hơn, tư duy cho rằng chúng ta sẽ có thể tiến gần và gần hơn vào việc tạo ra một phiên bản kỹ thuật số của não người.
Nhưng đây là một điều huyền bí, theo quan điểm của nhà khoa học máy tính Erik Larson, và tất cả bằng chứng cho thấy trí tuệ con người và máy tính là hoàn toàn khác biệt. Cuốn sách mới của Larson, Vết Mất Của Trí Tuệ Nhân Tạo: Tại Sao Máy Tính Không Thể Nghĩ Như Chúng Ta, thảo luận về cách các hiểu lầm rộng rãi về trí tuệ và suy luận đã đưa nghiên cứu trí tuệ nhân tạo vào những con đường hẹp hòi, hạn chế sự đổi mới và khám phá khoa học.
Và trừ khi các nhà khoa học, nhà nghiên cứu và các tổ chức hỗ trợ công việc của họ không thay đổi hướng đi, Larson cảnh báo, họ sẽ bị kết án đến “đầu hàng trước sự xâm chiếm của một thế giới máy móc, nơi sáng tạo đích thực bị lên lịch sang một bên để ủng hộ cuộc trò chuyện tương lai, thường từ những lợi ích cố định.”
Vết Mất Của Trí Tuệ Nhân Tạo
The Myth of Artificial Intelligence, by Erik J. LarsonTừ góc độ khoa học, huyền bí của Trí Tuệ Nhân Tạo giả định rằng chúng ta sẽ đạt được trí tuệ nhân tạo tổng quát (AGI) thông qua việc tiến triển trên các ứng dụng hẹp như phân loại hình ảnh, hiểu lệnh giọng nói, hoặc chơi trò chơi. Nhưng các công nghệ đằng sau những hệ thống trí tuệ nhân tạo hẹp này không giải quyết những thách thức rộng lớn cần phải giải quyết cho khả năng trí tuệ tổng quát, như việc thực hiện cuộc trò chuyện cơ bản, hoàn thành các công việc đơn giản trong nhà, hoặc các nhiệm vụ khác đòi hỏi lẽ thường.
“Khi chúng ta áp dụng thành công các phiên bản đơn giản, hẹp hòi của trí tuệ được hưởng lợi từ máy tính nhanh và nhiều dữ liệu, chúng ta không tiến triển từng bước, mà thay vào đó chúng ta chỉ đang chọn quả trái ở phía dưới,” Larson viết.
Hậu quả văn hóa của huyền bí về Trí Tuệ Nhân Tạo là phớt lờ bí ẩn bí ẩn khoa học của trí tuệ và liên tục nói về sự tiến triển liên quan đến học sâu và các công nghệ đương đại khác. Huyền bí này ngăn chặn các nhà khoa học khỏi việc nghĩ về cách mới để giải quyết thách thức của trí tuệ.
“Chúng ta khó có thể đạt được sự đổi mới nếu chúng ta chọn lời phủ nhận một bí ẩn cốt lõi thay vì đối mặt với nó,” Larson viết. “Một văn hóa khỏe mạnh cho sự đổi mới nhấn mạnh vào việc khám phá những điều chưa biết, không hype về sự mở rộng của các phương pháp hiện tại… Thần thoại về sự thành công tất yếu trong Trí Tuệ Nhân Tạo thường làm tắt đi văn hóa sáng tạo cần thiết cho sự tiến triển thực sự.”
Suy luận suy diễn, suy luận tiến cảm, và suy luận suy biến
Bạn bước ra khỏi nhà và nhận thấy đường ẩm ướt. Sự suy nghĩ đầu tiên của bạn là phải có mưa. Nhưng trời đang nắng và lối đi bộ khô, vì vậy bạn ngay lập tức loại bỏ khả năng mưa. Khi bạn nhìn sang bên, bạn thấy có một chiếc xe chở nước đậu xuống đường. Bạn kết luận rằng đường ẩm vì chiếc xe đổ nước rửa.
Đây là một ví dụ về “suy luận,” hành động đi từ quan sát đến kết luận, và là chức năng cơ bản của các hình thức thông minh. Chúng ta liên tục suy luận dựa trên những gì chúng ta biết và những gì chúng ta nhận thức. Hầu hết điều này xảy ra tiềm ẩn, trong nền tâm trí của chúng ta, mà không cần sự tập trung và chú ý trực tiếp.
“Bất kỳ hệ thống nào suy luận phải có một trí tuệ cơ bản, vì hành động sử dụng những điều đã biết và những điều quan sát để cập nhật niềm tin không thể tránh khỏi những gì chúng ta hiểu là trí tuệ,” Larson viết.
Các nhà nghiên cứu trí tuệ nhân tạo dựa trên hai loại máy suy luận: suy luận suy diễn và suy luận tiến cảm. Suy luận suy diễn sử dụng kiến thức trước để suy luận về thế giới. Đây là cơ sở của trí tuệ nhân tạo biểu tượng, trọng tâm chính của các nhà nghiên cứu trong những thập kỷ đầu của trí tuệ nhân tạo. Các kỹ sư tạo ra các hệ thống biểu tượng bằng cách trang bị chúng với một bộ quy tắc và sự thật được định trước, và trí tuệ nhân tạo sử dụng kiến thức này để suy luận về dữ liệu mà nó nhận được.
Suy luận tiến cảm, mà đã đạt được sự chú ý hơn trong thập kỷ qua, là việc học thông qua kinh nghiệm. Thuật toán học máy là những bộ suy luận tiến cảm. Một mô hình học máy được huấn luyện trên các ví dụ liên quan sẽ tìm ra các mẫu ánh xạ đầu vào đến đầu ra. Trong những năm gần đây, các nhà nghiên cứu trí tuệ nhân tạo đã sử dụng học máy, dữ liệu lớn và bộ xử lý tiên tiến để huấn luyện mô hình trên các nhiệm vụ mà trước đây vượt quá khả năng của các hệ thống biểu tượng.
Một loại suy luận thứ ba, suy luận suy biến, được giới thiệu lần đầu tiên bởi nhà khoa học người Mỹ Charles Sanders Peirce vào thế kỷ 19. Suy luận suy biến là khả năng kognitiv để đưa ra trực giác và giả thuyết, đưa ra đoán chính xác hơn so với những cú đâm ngẫu nhiên vào sự thật.
American scientist Charles Sanders Peirce proposed abductive inference in the 19th century. Image via New York Public Library, Public DomainVí dụ, có thể có nhiều lý do khiến đường ẩm ướt (bao gồm cả những lý do mà chúng ta chưa trực tiếp trải qua), nhưng suy luận suy biến giúp chúng ta chọn lựa những giả thuyết có triển vọng nhất, nhanh chóng loại bỏ những giả thuyết sai, tìm kiếm những giả thuyết mới và đạt đến một kết luận đáng tin cậy. Như Larson nói trong The Myth of Artificial Intelligence, “Chúng ta đoán, từ một nền tảng của vô số khả năng hiệu quả, những giả thuyết nào có vẻ có khả năng hoặc có vẻ có lý.”
Suy luận suy biến là điều nhiều người gọi là “sự hiểu biết thông thường.” Đây là khung tư duy mà chúng ta nhìn nhận sự thật hoặc dữ liệu và là keo dính kết nối giữa các loại suy luận khác nhau. Nó giúp chúng ta tập trung vào điều gì đó quan trọng trong số lượng thông tin lớn tồn tại trong tâm trí chúng ta và lượng dữ liệu lớn chúng ta đang nhận thông qua giác quan.
Vấn đề là cộng đồng trí tuệ nhân tạo chưa chú ý đủ đến suy luận suy biến.
Trí tuệ nhân tạo và suy luận suy biến
Suy luận suy biến xuất hiện trong cuộc thảo luận về trí tuệ nhân tạo với những nỗ lực về Lập trình Logic Suy Biến trong những năm 1980 và 1990, nhưng những nỗ lực đó bị thiếu sót và sau đó bị bỏ. “Chúng là các biến thể của lập trình logic, một biến thể của suy luận,” Larson nói với TechTalks.
Erik J. Larson, author of The Myth of Artificial IntelligenceSuy luận suy biến có cơ hội khác trong thập kỷ 2010 với mạng Bayesian, các máy suy luận cố gắng tính toán nguyên nhân. Nhưng giống như các phương pháp trước đó, các phương pháp mới cũng có điểm yếu là không nắm bắt được suy luận suy biến đích thực, Larson nói thêm rằng các mô hình đồ họa Bayesian và khác “là các biến thể của suy luận.” Trong Vết Mất Của Trí Tuệ Nhân Tạo, ông đề cập đến chúng là “suy biến chỉ trong tên.”
Phần lớn lịch sử của trí tuệ nhân tạo đã bị chi phối bởi suy luận suy diễn và suy luận tiến cảm.
“Khi những người tiên phong trong lĩnh vực trí tuệ nhân tạo như [Alan] Newell, [Herbert] Simon, [John] McCarthy và [Marvin] Minsky đặt câu hỏi về suy luận nhân tạo (lõi của trí tuệ nhân tạo), họ giả định rằng việc viết các quy tắc theo kiểu suy luận sẽ đủ để tạo ra suy nghĩ và hành động thông minh,” Larson nói. “Thực sự, đó chưa bao giờ là trường hợp, như đã nên được công nhận sớm hơn trong các cuộc thảo luận về cách chúng ta làm khoa học.”
Trong nhiều thập kỷ, những nghiên cứu viên đã cố gắng mở rộng sức mạnh của các hệ thống trí tuệ nhân tạo biểu tượng bằng cách cung cấp cho chúng các quy tắc và sự thật được viết bằng tay. Giả định là nếu bạn trang bị một hệ thống trí tuệ nhân tạo với tất cả kiến thức mà con người biết, nó sẽ có khả năng hành động một cách thông minh như con người. Nhưng trí tuệ nhân tạo biểu tượng thuần túy đã thất bại vì nhiều lý do. Hệ thống biểu tượng không thể học và thêm kiến thức mới, điều này làm cho chúng cứng nhẻo. Việc tạo ra trí tuệ nhân tạo biểu tượng trở thành cuộc rượt đuổi không ngừng của việc thêm mới các sự thật và quy tắc chỉ để phát hiện hệ thống đang mắc phải những sai lầm mới mà nó không thể sửa chữa. Và phần lớn kiến thức của chúng ta là ngụ ý và không thể được diễn đạt bằng quy tắc và sự thật để cung cấp cho các hệ thống biểu tượng.
“Điều thú vị ở đây là không ai thực sự dừng lại và nói ‘Chờ một chút. Điều này sẽ không hoạt động!’” Larson nói. “Điều đó đã chuyển hướng nghiên cứu trực tiếp về suy luận suy biến hoặc tạo giả thuyết hoặc, ví dụ, ‘suy luận nhạy cảm với bối cảnh.’”
Trong hai thập kỷ qua, với sự phổ biến ngày càng tăng của dữ liệu và tài nguyên tính toán, các thuật toán học máy—đặc biệt là mạng nơ-ron sâu—đã trở thành tâm điểm của sự chú ý trong cộng đồng trí tuệ nhân tạo. Công nghệ học sâu đã mở khóa nhiều ứng dụng trước đây vượt quá giới hạn của máy tính. Và nó đã thu hút sự quan tâm và tiền từ một số công ty giàu có nhất thế giới.
“Tôi nghĩ với sự xuất hiện của World Wide Web, các phương pháp kinh nghiệm hoặc suy luận tiến cảm (tập trung vào dữ liệu) đã chiếm ưu thế, và suy luận suy biến, giống như suy luận suy diễn, đã lãng quên lớn,” Larson nói.
Nhưng các hệ thống học máy cũng gặp những hạn chế nghiêm trọng, bao gồm thiếu nguyên nhân, xử lý kém các trường hợp biên, và cần quá nhiều dữ liệu. Và những hạn chế này trở nên rõ ràng và gây vấn đề hơn khi các nhà nghiên cứu cố gắng áp dụng học máy vào các lĩnh vực nhạy cảm như chăm sóc sức khỏe và tài chính.
Suy luận suy biến và hướng phát triển của trí tuệ nhân tạo
An illustration of machine learning causalityMột số nhà khoa học, bao gồm cả người tiên phong trong việc học tăng cường như Richard Sutton, tin rằng chúng ta nên tuân thủ các phương pháp có thể mở rộng theo sự có sẵn của dữ liệu và tính toán, tức là học và tìm kiếm. Ví dụ, khi mạng nơ-ron trở nên lớn hơn và được đào tạo trên nhiều dữ liệu hơn, chúng cuối cùng sẽ vượt qua giới hạn của mình và dẫn đến các đột phá mới.
Larson bác bỏ việc mở rộng trí tuệ nhân tạo dựa trên dữ liệu là “về cơ bản là mô hình sai lầm cho trí tuệ.” Mặc dù cả tìm kiếm và học có thể cung cấp các ứng dụng hữu ích, nhưng chúng dựa trên suy luận không phải suy luận suy biến, ông nhấn mạnh.
“Tìm kiếm sẽ không mở rộng thành suy luận thông thường hoặc suy luận suy biến mà không có một cuộc cách mạng trong tư duy về suy luận, điều đó vẫn chưa xảy ra. Tương tự với học máy, tính chất dựa trên dữ liệu của các phương pháp học nghĩa là suy luận cơ bản phải nằm trong dữ liệu, để nói một cách nói khác, và điều đó rõ ràng không đúng với nhiều suy luận thông minh mà con người thường xuyên thực hiện,” Larson nói. “Chúng ta không chỉ nhìn vào quá khứ, được ghi lại, ví dụ như trong một bộ dữ liệu lớn, để tìm ra điều gì để kết luận hoặc nghĩ hoặc suy luận về tương lai.”
Một số nhà khoa học tin rằng trí tuệ nhân tạo kết hợp các hệ thống biểu tượng và mạng nơ-ron sẽ hứa hẹn hơn trong việc giải quyết các hạn chế của học sâu. Một ví dụ là IBM Watson, nổi tiếng khi đánh bại các nhà vô địch thế giới ở Jeopardy! Các mô hình hỗn hợp thực nghiệm gần đây đã cho thấy kết quả tích cực trong các ứng dụng nơi trí tuệ nhân tạo biểu tượng và học sâu một mình thực hiện kém.
Larson tin rằng các hệ thống hỗn hợp có thể điền vào những khoảng trống trong các phương pháp chỉ học máy hoặc chỉ dựa trên quy tắc. Là một nghiên cứu viên trong lĩnh vực xử lý ngôn ngữ tự nhiên, ông đang làm việc để kết hợp các mô hình ngôn ngữ lớn được đào tạo trước như GPT-3 với công việc cũ trên web ngữ nghĩa dưới dạng đồ thị tri thức để tạo ra các ứng dụng tốt hơn trong tìm kiếm, trả lời câu hỏi và các nhiệm vụ khác.
“Nhưng các kết hợp suy luận suy biến không đưa chúng ta đến suy luận suy biến, vì ba loại suy luận này hình thức hoàn toàn khác biệt, vì vậy chúng không thu gọn với nhau và không thể kết hợp để tạo ra một thứ thứ ba,” ông nói.
Trong The Myth of Artificial Intelligence, Larson mô tả những nỗ lực né tránh suy luận suy biến như là “bẫy suy luận.”
“Các kỹ thuật được tạo cảm hứng chủ yếu từ sự suy diễn như học máy vẫn chưa đủ, dù máy tính có nhanh đến đâu, và các hệ thống hỗn hợp như Watson cũng không đạt được sự hiểu biết tổng quát,” ông viết. “Trong các tình huống mở với yêu cầu về kiến thức về thế giới như hiểu ngôn ngữ, suy luận suy biến là trung tâm và không thể thay thế. Do đó, những nỗ lực kết hợp chiến lược suy luận suy biến và suy luận suy diễn luôn bị định mệnh thất bại... Ngành này cần một lý thuyết cơ bản về suy luận suy biến. Trong lúc chờ đợi, chúng ta bị mắc kẹt trong các bẫy.”
Sự thương mại hóa của trí tuệ nhân tạo

những nguồn dữ liệu rộng lớn và túi sâuđẩy các nhà nghiên cứu rời khỏi giảng đường
Sự chuyển đổi này đã làm cho việc các phòng lab phi lợi nhuận và các công ty nhỏ tham gia nghiên cứu trí tuệ nhân tạo trở nên rất khó khăn.
“Khi bạn liên kết nghiên cứu và phát triển trong trí tuệ nhân tạo với quyền sở hữu và kiểm soát của các tập dữ liệu rất lớn, bạn sẽ có một rào cản đối với các start-up, những người không sở hữu dữ liệu,” Larson nói thêm rằng trí tuệ nhân tạo dựa trên dữ liệu bản chất tạo ra các kịch bản “người thắng cả” trong khu vực thương mại.
Sự thống trị của trí tuệ nhân tạo lẽ ra làm chậm quá trình nghiên cứu khoa học. Với các công ty công nghệ lớn tập trung vào việc tạo ra các ứng dụng mà họ có thể tận dụng tài nguyên dữ liệu rộng lớn của mình để duy trì sự ưu thế so với đối thủ, có ít động lực để khám phá các phương pháp thay thế trong trí tuệ nhân tạo. Công việc trong lĩnh vực bắt đầu chệch hướng về các ứng dụng hẹp và có lợi nhuận, với chi phí là những nỗ lực có thể dẫn đến sự sáng tạo mới.
“Hiện tại không ai biết được trí tuệ nhân tạo sẽ như thế nào nếu thiếu những tập dữ liệu tập trung khổng lồ như vậy, vì vậy không có gì thực sự hấp dẫn với những doanh nhân muốn cạnh tranh bằng cách thiết kế trí tuệ nhân tạo khác biệt và mạnh mẽ hơn,” Larson nói.
Trong cuốn sách của mình, Larson cảnh báo về văn hóa trí tuệ nhân tạo hiện tại, mà “đang ép kiếm lời từ những trái cây thấp,” trong khi tiếp tục quay vòng tròn về thần thoại trí tuệ nhân tạo.” Ảo tưởng về sự tiến triển về trí tuệ nhân tạo tổng quát có thể dẫn đến một mùa đông trí tuệ nhân tạo, ông viết.
Nhưng trong khi một mùa đông trí tuệ nhân tạo có thể làm giảm sự quan tâm đối với học sâu và trí tuệ nhân tạo dựa trên dữ liệu, nó có thể mở đường cho một thế hệ mới của những người tìm kiếm khám phá những con đường mới. Larson hy vọng các nhà khoa học bắt đầu nhìn xa hơn các phương pháp hiện tại.
Trong cuốn sách The Myth of Artificial Intelligence, Larson cung cấp một khuôn khổ suy luận để làm sáng tỏ những thách thức mà lĩnh vực đang phải đối mặt hôm nay và giúp độc giả nhìn thấu những tuyên bố quá mức về tiến triển đối với AGI hoặc đỉnh điểm.
“Tôi hy vọng rằng người không chuyên môn sẽ có một số công cụ để đối phó với loại tư duy tất yếu này, mà không phải là khoa học, và rằng đồng nghiệp của tôi và những nhà khoa học trí tuệ nhân tạo khác có thể xem đó là một cuộc gọi tỉnh giấc để bắt đầu làm việc trên những vấn đề rất thực tế mà lĩnh vực đang phải đối mặt,” Larson nói.
Bài viết này ban đầu được đăng bởi Ben Dickson trên TechTalks, một xuất bản phẩm nghiên cứu xu hướng trong công nghệ, cách chúng ảnh hưởng đến cuộc sống và kinh doanh của chúng ta, và những vấn đề mà chúng giải quyết. Nhưng chúng tôi cũng thảo luận về mặt tối của công nghệ, những hậu quả tối tăm của công nghệ mới, và những điều chúng ta cần phải cảnh báo. Bạn có thể đọc bài viết gốc tại đây.
