3 cách mà những học giả thế hệ mới có thể tránh được mùa đông AI không cần thiết
Có hai hiện thực khi nói về trí tuệ nhân tạo. Trong một hiện thực, tương lai rất tươi sáng đến mức bạn cần đeo kính hàn chỉ để liếc nhìn vào nó. AI là một công nghệ cốt lõi mà không kém cần thiết cho các hoạt động của con người trên toàn cầu như điện và internet. Nhưng trong hiện thực khác, mùa đông đang đến.
Một "mùa đông AI" là một khoảng thời gian trong đó không có gì có thể phát triển. Điều đó có nghĩa là không ai đang tuyển dụng, không ai đang mua lại, và không ai đang tài trợ. Nhưng mùa khô cạn đang đến này là đặc biệt, nó sẽ không ảnh hưởng đến toàn bộ ngành công nghiệp.
Thực tế, hầu hết những chuyên gia sẽ thậm chí không chú ý đến nó. Google, OpenAI, DeepMind, Nvidia, Meta, IBM, và bất kỳ trường đại học nào thực hiện nghiên cứu đáng tin cậy đều không cần lo lắng. Các doanh nghiệp khởi nghiệp với một mục tiêu rõ ràng và hữu ích sẽ ổn — những vấn đề thị trường thông thường không kể.
Người duy nhất cần quan tâm đến cái lạnh sắp tới là những người cố gắng thực hiện những gì chúng ta sẽ gọi là "học thuật hòm đen."
Học thuật hòm đen
Tôi rùng mình khi gọi bất kỳ nỗ lực trí tuệ nhân tạo nào là "học thuật hòm đen," bởi ít nhất ý tưởng về việc biến một kim loại thành kim loại khác có một số giá trị khoa học.
Tôi đang nói về xu hướng nghiên cứu vô cùng phổ biến trong đó các nhà nghiên cứu xây dựng những mô hình dự đoán tệ và sau đó tạo ra vấn đề giả để AI giải quyết tốt hơn con người.
Khi bạn viết tất cả trong một câu, nó nghe có vẻ như nên là rất rõ ràng rằng đó là một cú lừa. Nhưng tôi ở đây để nói cho bạn biết rằng học thuật hòm đen đại diện cho một phần lớn của nghiên cứu học thuật ngay bây giờ, và đó là một điều tồi tệ.
Học thuật hòm đen là điều xảy ra khi các nhà nghiên cứu trí tuệ nhân tạo lấy điều gì đó mà trí tuệ nhân tạo làm tốt — chẳng hạn như trả kết quả liên quan khi bạn tìm kiếm điều gì đó trên Google — và cố gắng sử dụng cùng nguyên tắc để làm điều không thể. Vì AI không thể giải thích tại sao nó đến với kết quả như vậy (vì công việc diễn ra trong hòm đen mà chúng ta không thể nhìn thấy bên trong), các nhà nghiên cứu giả vờ họ đang làm khoa học mà không cần phải thể hiện bất kỳ công việc nào.
Đây là một trò lừa đảo diễn ra trong vô số mô hình từ dự đoán trộm và thuật toán tái phạm tới những hệ thống nhận dạng khuôn mặt vô nghĩa được cho là phát hiện mọi thứ từ chính trị của một người đến việc họ có khả năng trở thành kẻ khủng bố.
Phần không thể nhấn mạnh đủ là chiêu lừa đảo này đặc biệt là đang được thực hiện trong toàn bộ cộng đồng học thuật. Không quan trọng nếu bạn dự định tham gia một trường cộng đồng hoặc Stanford, học thuật hòm đen đang ở khắp mọi nơi.
Dưới đây là cách chiêu lừa đảo hoạt động: các nhà nghiên cứu nảy ra một kế hoạch cho phép họ phát triển một mô hình trí tuệ nhân tạo "chính xác hơn" ở một nhiệm vụ cụ thể so với con người.
Điều này, đúng nghĩa đen, là phần khó khăn nhất. Bạn không thể chọn một nhiệm vụ đơn giản, chẳng hạn như nhìn vào hình ảnh và quyết định có con mèo hay chó trong đó. Con người sẽ làm hỏng AI trong công việc này 100 lần trên 100 lần. Chúng ta rất giỏi trong việc phân biệt giữa mèo và chó.
Và bạn không thể chọn một nhiệm vụ quá phức tạp. Ví dụ, không có lý nào để đào tạo một mô hình dự đoán để xác định những bằng sáng chế những năm 1930 sẽ liên quan nhất đến ứng dụng nhiệt độ học hiện đại. Số lượng con người có thể thắng trong trò chơi đó quá nhỏ để quan trọng.
Bạn phải chọn một nhiệm vụ mà người thông thường nghĩ rằng có thể quan sát, đo lường và báo cáo thông qua phương pháp khoa học, nhưng thực sự không thể.
Sau khi bạn đã làm điều đó, phần còn lại là dễ dàng.
Gaydar
Ví dụ yêu thích của tôi về black box alchemy là bài báo Gaydar của Stanford. Đó là một kiệt tác trong thể loại AI lừa đảo.
Các nhà nghiên cứu đã đào tạo một hệ thống thị giác máy tính cơ bản trên cơ sở dữ liệu các khuôn mặt người. Những khuôn mặt được gắn nhãn với các thẻ được báo cáo tự xác định liệu người được chụp có định danh là đồng tính hay thẳng.
Theo thời gian, họ đã đạt được độ chính xác vượt trội so với con người. Theo nhận định của các nhà nghiên cứu, AI có khả năng phân biệt khuôn mặt đồng tính tốt hơn con người và không ai biết tại sao.
Dưới đây là sự thật: không có con người nào có thể biết được người khác có phải là đồng tính hay không. Chúng ta có thể đoán. Đôi khi chúng ta có thể đoán đúng, đôi khi chúng ta có thể đoán sai. Điều này không phải là khoa học.
Khoa học đòi hỏi quan sát và đo lường. Nếu không có gì để quan sát hoặc đo lường, chúng ta không thể thực hiện khoa học.
Sự đồng tính không phải là một sự thật cơ bản. Không có đo lường khoa học cho sự đồng tính.
Đây là ý tôi muốn truyền đạt: bạn có phải là người đồng tính nếu bạn có sự hấp dẫn đồng giới hay chỉ khi bạn hành động theo nó? Bạn có thể là trinh nữ đồng tính không? Bạn có thể có trải nghiệm kỳ cựu và vẫn giữ định danh thẳng? Cần bao nhiêu suy nghĩ đồng tính để bạn được xem là đồng tính, và ai có quyền quyết định điều đó?
Sự thật đơn giản là tình dục con người không phải là một điểm bạn có thể vẽ trên biểu đồ. Không ai có thể xác định xem người khác có phải là đồng tính hay không. Con người có quyền giữ bí mật về tình dục của họ, từ chối tình dục trải nghiệm của họ và quyết định bao nhiêu "đồng tính" hoặc "thẳng" họ cần trong cuộc sống của mình để quyết định nhãn của họ.
Không có kiểm tra khoa học cho đồng tính. Và điều đó có nghĩa là đội ngũ Stanford không thể đào tạo một AI để phát hiện đồng tính; nó chỉ có thể đào tạo một AI để cố gắng vượt qua con người trong một trò chơi phân biệt mà không có ứng dụng thực tế tích cực nào.
Ba giải pháp
Bài báo về gaydar của Stanford chỉ là một trong hàng nghìn ví dụ về black box alchemy mà có sẵn. Không ai nên ngạc nhiên về việc nghiên cứu này trở nên phổ biến, đó là quả dừa thấp của nghiên cứu ML.
Hai mươi năm trước, số lượng tốt nghiệp trung học quan tâm đến học máy chỉ là một giọt nước so với số lượng thiếu niên sẽ bắt đầu đại học để có bằng AI trong năm nay.
Điều đó là tốt và xấu đồng thời. Điều tốt là có nhiều nhà nghiên cứu AI/ML tài năng trên thế giới hôm nay hơn bao giờ hết - và con số đó sẽ tiếp tục tăng lên.
Điều xấu là mọi lớp học AI trên hành tinh này đều chứa đầy sinh viên không hiểu sự khác biệt giữa một Magic 8-Ball và một mô hình dự đoán - và có thậm chí còn ít người hiểu tại sao cái trước lại hữu ích hơn trong việc dự đoán kết quả con người.
Và điều đó đưa chúng ta đến ba điều mà mọi sinh viên, nhà nghiên cứu, giáo sư và nhà phát triển AI có thể làm để làm cho cả lĩnh vực AI/ML trở nên tốt hơn cho mọi người.
- Không thực hiện black box alchemy. Câu hỏi đầu tiên bạn nên đặt trước khi bắt đầu bất kỳ dự án AI nào liên quan đến dự đoán là: liệu điều này có ảnh hưởng đến kết quả con người không? Nếu khoa học duy nhất bạn có thể sử dụng để đo lường hiệu suất dự án của bạn là so sánh nó với độ chính xác của con người, có khả năng bạn đang làm công việc tốt.
- Không tạo ra các mô hình mới với mục đích chỉ để vượt qua các tiêu chí được đặt ra bởi các mô hình trước đó chỉ vì bạn không thể chi trả để xây dựng cơ sở dữ liệu hữu ích.
- Không đào tạo mô hình trên dữ liệu mà bạn không thể đảm bảo độ chính xác và đa dạng.
Tôi muốn kết thúc bài viết này chỉ với ba mẹo như một kiểu tự tin khi rời bỏ micro, nhưng không phải là lúc đó.
Thực tế là một phần lớn sinh viên có khả năng sẽ gặp khó khăn trong việc thực hiện bất cứ điều gì mới mẻ trong lĩnh vực AI/ML mà không vi phạm cả ba quy tắc đó. Điều này xảy ra vì black box alchemy dễ dàng, việc xây dựng cơ sở dữ liệu tùy chỉnh gần như là không thể với những người không có nguồn lực của các công ty công nghệ lớn, và chỉ có một số ít trường đại học và công ty có khả năng đào tạo mô hình với số lượng tham số lớn.
Chúng ta đang bị mắc kẹt ở một nơi mà đa số sinh viên và những nhà phát triển muốn trở thành không có tài nguyên cần thiết để vượt qua việc chỉ cố gắng tìm cách 'cool' để sử dụng các thuật toán nguồn mở.
Cách duy nhất để vượt qua thời kỳ này và đi vào một giai đoạn sản xuất hơn là để thế hệ phát triển tiếp theo từ chối các xu hướng hiện tại và tạo ra một con đường đi khỏi tình trạng hiện tại - giống như những nhà phát triển AI tiên phong hiện tại đã làm vào thời đại của họ.
