
Tuần trước, Microsoft thông báo rằng họ đã đạt được một kỷ lục mới về độ chính xác của phần mềm chuyển văn bản từ giọng nói. Hệ thống của họ chỉ bỏ sót một trong mỗi 20 từ trong một bộ ghi âm cuộc gọi điện thoại tiêu chuẩn—tương đương với con người khi đặt ra thách thức tương tự.
Kết quả này là điểm sáng nhất trong chuỗi các khám phá gần đây được một số người coi là bằng chứng cho việc tiến bộ trong trí tuệ nhân tạo đang tăng tốc, đe dọa làm đảo lộn nền kinh tế. Một số phần mềm đã chứng minh mình giỏi hơn con người trong việc nhận diện đối tượng như ô tô hoặc mèo trong hình ảnh, và phần mềm AlphaGo của Google đã đánh bại nhiều nhà vô địch Go—một thành tựu mà cho đến gần đây được coi là ít nhất một thập kỷ. Các công ty đang hăng hái xây dựng trên tiến triển này; số lần đề cập đến AI trong cuộc họp báo cáo doanh thu của các công ty đã tăng lên gần như theo cấp số mũ.
Bây giờ một số nhà quan sát AI đang cố gắng phát triển một bức tranh chính xác hơn về cách, và tốc độ, công nghệ đang tiến triển. Bằng cách đo lường tiến bộ—hoặc thiếu hụt nó—trong các lĩnh vực khác nhau, họ hy vọng xâm nhập màn sương thông tin về AI. Các dự án nhằm mang lại cho các nhà nghiên cứu và nhà quyết định chính trị một cái nhìn rõ ràng hơn về những phần của lĩnh vực đang tiến triển nhanh chóng nhất và những phản ứng mà điều đó có thể đòi hỏi.

“Điều này cần được thực hiện một phần bởi vì có quá nhiều điều điên rồ về tương lai của trí tuệ nhân tạo,” nói Ray Perrault, một nhà nghiên cứu tại phòng thí nghiệm phi lợi nhuận SRI International. Ông là một trong những người đứng đầu dự án được gọi là Chỉ Số Trí Tuệ Nhân Tạo, mục tiêu là phát hành một bức tranh chi tiết về tình hình và tốc độ tiến triển trong lĩnh vực này vào cuối năm. Dự án được hỗ trợ bởi Nghiên cứu Trí Tuệ Nhân Tạo Trăm Năm, thành lập tại Stanford vào năm 2015 để xem xét tác động của trí tuệ nhân tạo đối với xã hội.
Các tuyên bố về sự tiến bộ của trí tuệ nhân tạo đang xuất hiện ở khắp mọi nơi ngày nay, kể cả từ những người quảng cáo đồ ăn nhanh và bàn chải đánh răng. Ngay cả những tuyên bố từ các nhóm nghiên cứu chặt chẽ cũng có thể khó đánh giá. Microsoft đầu tiên thông báo rằng họ đã sánh kịp với con người trong việc nhận diện giọng nói vào tháng 10 năm ngoái. Nhưng các nhà nghiên cứu tại IBM và công ty Appen sau đó đã chứng minh rằng con người chính xác hơn so với những gì Microsoft tuyên bố. Hãng phần mềm lớn này đã phải giảm tỷ lệ lỗi thêm 12% để có thể tuyên bố sánh kịp với con người lần này.

Tổ chức Electronic Frontier Foundation, chiến dịch bảo vệ tự do dân sự khỏi các mối đe doạ số, đã bắt đầu nỗ lực riêng của mình để đo lường và đặt vào ngữ cảnh sự tiến triển trong trí tuệ nhân tạo. Tổ chức phi lợi nhuận này đang tìm kiếm các bài nghiên cứu như của Microsoft để tạo ra một kho dữ liệu nguồn mở trực tuyến về các chỉ số tiến triển và hiệu suất của trí tuệ nhân tạo. “Chúng tôi muốn biết có những tác động chính trị ngay và dài hạn nào của phiên bản thực sự của trí tuệ nhân tạo, so với phiên bản mơ hồ mà mọi người quá phấn khích,” Peter Eckersley, nhà khoa học máy tính chính của EFF, nói.

Cả hai dự án đều chú trọng mạnh vào nghiên cứu công bố về học máy và trí tuệ nhân tạo. Ví dụ, kho dữ liệu của EFF bao gồm biểu đồ cho thấy sự tiến triển nhanh chóng trong nhận diện hình ảnh từ năm 2012—và sự chênh lệch giữa hiệu suất của máy và con người trên một bài kiểm tra thách thức phần mềm hiểu sách trẻ em. Dự án Chỉ Số Trí Tuệ Nhân Tạo đang tìm cách đồng đều xu hướng trong các lĩnh vực con của trí tuệ nhân tạo đang thu hút sự chú ý của nhà nghiên cứu.
Chỉ Số Trí Tuệ Nhân Tạo cũng sẽ cố gắng theo dõi và đo lường cách trí tuệ nhân tạo đang được áp dụng vào thực tế. Perrault nói rằng việc theo dõi số lượng kỹ sư làm việc với công nghệ và số đô la đầu tư chảy vào các công ty tập trung vào trí tuệ nhân tạo có thể hữu ích. Mục tiêu là “tìm ra nghiên cứu này đang ảnh hưởng như thế nào đối với sản phẩm thương mại,” ông nói—mặc dù ông thừa nhận rằng các công ty có thể không sẵn lòng công bố dữ liệu. Dự án Chỉ Số Trí Tuệ Nhân Tạo cũng đang làm việc để theo dõi số lượng và tâm trạng của sự chú ý từ phương tiện truyền thông và công chúng đối với trí tuệ nhân tạo.
Perrault nói rằng dự án nên thu hút một độc giả rộng lớn vì các nhà nghiên cứu và các cơ quan tài trợ sẽ muốn xem lĩnh vực trí tuệ nhân tạo nào đang có đà phát triển mạnh mẽ nhất, hoặc cần được hỗ trợ và ý tưởng mới. Ông nói rằng các ngân hàng và công ty tư vấn đã gọi điện, tìm kiếm một cách kiểm soát tốt hơn về những điều thực sự trong trí tuệ nhân tạo. Mối tình yêu của ngành công nghiệp công nghệ kéo dài nhiều thập kỷ với Định luật Moore, đo lường và dự báo tiến triển trong bộ xử lý máy tính, ngụ ý rằng biểu đồ về tiến triển trí tuệ nhân tạo sẽ có một độc giả sẵn sàng tại Silicon Valley.
Không rõ lắm là các biện pháp như vậy có thể giúp ích như thế nào cho các quan chức chính phủ và người quyết định chính trị đang đối mặt với các ảnh hưởng của phần mềm thông minh trong lĩnh vực như quyền riêng tư. “Tôi không chắc liệu nó có hữu ích không,” nói Ryan Calo, giáo sư luật tại Đại học Washington, người gần đây đã đề xuất một kế hoạch chi tiết về các vấn đề chính sách trí tuệ nhân tạo. Ông cho rằng những người quyết định cần hiểu biết cơ bản về công nghệ cơ bản, và một tầm nhìn mạnh mẽ về giá trị, hơn là các biện pháp cụ thể về tiến triển.
Eckersley của EFF cho rằng các dự án theo dõi trí tuệ nhân tạo sẽ trở nên hữu ích hơn theo thời gian. Ví dụ, cuộc tranh luận về việc mất việc có thể được thông tin bằng dữ liệu về tốc độ tiến triển của các chương trình phần mềm để tự động hóa các nhiệm vụ cốt lõi của một số công nhân nhất định. Eckersley nói rằng việc nhìn vào các biện pháp tiến triển trong lĩnh vực đã giúp ông thuyết phục về sự quan trọng của công việc về cách làm cho các hệ thống trí tuệ nhân tạo đáng tin cậy hơn. "Dữ liệu chúng tôi thu thập hỗ trợ ý kiến rằng an toàn và bảo mật của các hệ thống trí tuệ nhân tạo là một lĩnh vực nghiên cứu quan trọng và có lẽ cần đặc biệt," ông nói.
Các nhà nghiên cứu trong giới học thuật và tại các công ty như Google gần đây đã nghiên cứu cách lừa dối hoặc gài bẫy phần mềm trí tuệ nhân tạo và ngăn chặn nó khỏi việc hoạt động sai lầm. Khi các công ty đua nhau đưa phần mềm kiểm soát nhiều công nghệ thông thường khác nhau như ô tô, tiến triển đo lường về cách làm cho nó đáng tin cậy và an toàn có thể là quan trọng nhất trong tất cả.