Trí tuệ Nhân tạo Có Thể Không 'Mộng Dục' Sau Tất Cả

Buzz

Ngày cập nhật gần nhất: 15/7/2026

Nội dung bài viết

Những điều tuyệt vời khác từ Mytour

Xem thêm

Đọc tóm tắt

- Các thuật toán nhận diện hình ảnh hiện đại có thể tạo ra hình ảnh giả mạo trông giống thật nhưng vẫn dễ bị ảnh hưởng bởi ví dụ phản đối, tức là hình ảnh được biến đổi để đánh lừa hệ thống.
- Nghiên cứu từ MIT chỉ ra rằng những ví dụ phản đối không phải do sự sai lệch của thuật toán mà do Trí tuệ Nhân tạo nhận biết các chi tiết mà mắt người không thấy được.
- Điều này gợi ý rằng các thuật toán dựa vào các đặc điểm vô hình mà con người không thể nhận ra, đặt ra thách thức trong việc giải thích quyết định của thuật toán và đảm bảo an toàn khi công nghệ được sử dụng rộng rãi.

Nhờ vào những tiến bộ trong học máy, máy tính đã trở nên rất giỏi trong việc xác định những gì có trong các bức ảnh. Chúng bắt đầu vượt qua con người trong nhiệm vụ này cách đây vài năm, và hiện có thể tạo ra những hình ảnh giả mạo mà nhìn có vẻ thực tế. Mặc dù công nghệ đã đi xa, nhưng vẫn chưa hoàn toàn an toàn. Đặc biệt, các nhà nghiên cứu đã phát hiện ra rằng các thuật toán nhận diện hình ảnh vẫn dễ bị ảnh hưởng bởi một loại vấn đề gọi là ví dụ phản đối.

Ví dụ phản đối giống như hiện tượng ảo (hoặc âm thanh) cho Trí tuệ Nhân tạo. Bằng cách biến đổi một số điểm ảnh, một nhà khoa học máy tính có thể đánh lừa một bộ phân loại học máy, khiến nó nghĩ rằng, ví dụ, một bức ảnh về một khẩu súng thực sự là một chiếc trực thăng. Nhưng đối với bạn hoặc tôi, bức ảnh vẫn trông giống như một súng—nó hầu như giống như thuật toán đang mộng dục. Khi công nghệ nhận diện hình ảnh được sử dụng rộng rãi hơn, ví dụ phản đối có thể tạo ra một rủi ro bảo mật đáng lo ngại. Chuyên gia đã chứng minh rằng chúng có thể được sử dụng để làm cho một chiếc ô tô tự lái bỏ qua biển cấm dừng, hoặc làm cho một hệ thống nhận diện khuôn mặt nhận dạng sai người nào đó.

Các tổ chức như Google và Quân đội Mỹ đã nghiên cứu ví dụ phản đối, nhưng điều gì chính xác tạo ra chúng vẫn là một bí ẩn lớn. Một phần vấn đề là thế giới thị giác cực kỳ phức tạp, và các bức ảnh có thể chứa hàng triệu điểm ảnh. Một vấn đề khác là làm thế nào để giải mã xem ví dụ phản đối có phải là sản phẩm của các bức ảnh gốc hay là cách mà Trí tuệ Nhân tạo được đào tạo để nhìn nhận chúng. Một số nhà nghiên cứu đặt giả thuyết rằng chúng là hiện tượng thống kê có số chiều cao, hoặc do Trí tuệ Nhân tạo không được đào tạo đủ dữ liệu.

Bây giờ, một nhóm nghiên cứu hàng đầu từ MIT đã tìm ra một câu trả lời khác, trong một bài báo được trình bày vào đầu tuần này: ví dụ phản đối chỉ trông giống như những ảo giác đối với con người. Trên thực tế, Trí tuệ Nhân tạo đang nhận biết những chi tiết nhỏ mà mắt người không thể cảm nhận được. Trong khi bạn có thể nhìn vào tai của động vật để phân biệt chó và mèo, Trí tuệ Nhân tạo phát hiện ra các mẫu nhỏ trong điểm ảnh của bức ảnh và sử dụng chúng để phân loại. “Điều duy nhất làm cho những đặc điểm này trở nên đặc biệt là chúng ta như con người không nhạy cảm với chúng,” nói Andrew Ilyas, một sinh viên tiến sĩ tại MIT và một trong những tác giả chính của công trình, chưa được đồng bộ hóa.

Giải thích này có ý nghĩa hợp lý, nhưng khó khăn trong việc ghi chép vì nó khó giải mã xem Trí tuệ Nhân tạo sử dụng những đặc điểm nào để phân loại một hình ảnh. Để thực hiện nghiên cứu của họ, các nhà nghiên cứu đã sử dụng một phương pháp mới để phân tách các đặc điểm “mạnh mẽ” của hình ảnh, mà con người thường có thể nhận thức được, từ những đặc điểm “không mạnh mẽ” mà chỉ có Trí tuệ Nhân tạo mới có thể phát hiện. Sau đó, trong một thí nghiệm, họ huấn luyện một bộ phân loại bằng cách sử dụng một tập dữ liệu hình ảnh có chủ ý không phù hợp. Theo các đặc điểm “mạnh mẽ”—tức là nhìn như thế nào đối với mắt người—các hình ảnh đó là của chó. Nhưng theo các đặc điểm “không mạnh mẽ”, mà mắt chúng ta không nhìn thấy, thì những bức ảnh thực sự là của mèo, và đó là cách mà bộ phân loại được đào tạo—nghĩa là nó nghĩ rằng những bức ảnh là của mèo.

Các nhà nghiên cứu sau đó thử nghiệm bằng cách hiển thị bộ phân loại những bức ảnh mới, bình thường của mèo mà nó chưa từng thấy trước đây. Nó có thể nhận diện đúng những bức ảnh của mèo, cho thấy Trí tuệ Nhân tạo đang dựa vào những đặc điểm ẩn không mạnh mẽ được nhúng trong tập dữ liệu đào tạo. Điều đó gợi ý những đặc điểm vô hình này đại diện cho các mẫu thực sự trong thế giới thị giác, chỉ là những mẫu mà con người không thể nhìn thấy. Và ví dụ phản đối là những trường hợp nơi những mẫu này không khớp với cách chúng ta nhìn nhận thế giới.

Khi các thuật toán mắc phải một ví dụ phản đối, chúng không phải là đang mộng dục—chúng đang nhìn thấy điều gì đó mà con người không thấy. “Đó không phải là mô hình đang làm điều gì kỳ lạ, chỉ là bạn không nhìn thấy những điều này thực sự có tính dự đoán,” nói Shibani Santurkar, một sinh viên tiến sĩ tại MIT và một tác giả chính khác của bài báo. “Đó là về việc con người không thể nhìn thấy những điều này trong dữ liệu.”

Nghiên cứu này đặt ra câu hỏi liệu các nhà khoa học máy tính có thể thực sự giải thích cách thuật toán của họ ra quyết định. “Nếu chúng ta biết rằng mô hình của chúng ta đang phụ thuộc vào những mẫu nhỏ mà chúng ta không nhìn thấy, thì chúng ta không thể giả vờ rằng chúng có thể giải thích theo cách của con người,” nói Santurkar. Điều đó có thể là vấn đề, ví dụ như khi ai đó cần chứng minh trước tòa rằng một thuật toán nhận diện khuôn mặt đã xác định họ sai. Có thể không có cách nào để giải thích tại sao thuật toán nghĩ rằng họ là người họ không phải là.

Các kỹ sư cuối cùng có thể cần phải đưa ra một sự lựa chọn giữa việc xây dựng các hệ thống tự động có độ chính xác cao nhất, so với những hệ thống giống nhất với con người. Nếu bạn buộc một thuật toán chỉ dựa vào các đặc điểm mạnh mẽ, có khả năng nó sẽ mắc nhiều lỗi hơn so với khi nó cũng sử dụng những đặc điểm ẩn không mạnh mẽ. Nhưng nếu Trí tuệ Nhân tạo cũng dựa vào những đặc điểm vô hình đó, nó có thể dễ bị tấn công hơn, chẳng hạn như ví dụ phản đối. Khi công nghệ nhận diện hình ảnh ngày càng được sử dụng nhiều cho các nhiệm vụ như nhận diện lời nói tục và quét hành lý tại sân bay, quyết định cách điều này có thể trở nên quan trọng hơn.

Những điều tuyệt vời khác từ Mytour

“Bức tường thường thất bại; chúng có những hậu quả không mong muốn”
Làm thế nào nếu máy điều hòa không khí có thể giúp cứu (không phải phá hủy) hành tinh?
Thủ thuật an toàn khi mua sắm trên Amazon
“Nếu bạn muốn giết ai đó, chúng tôi là những người phù hợp”
Kitty Hawk, ô tô bay, và những thách thức của “đi theo chiều 3D”
🏃🏽‍♀️ Muốn có những công cụ tốt nhất để có sức khỏe? Kiểm tra những lựa chọn của đội ngũ Gear chúng tôi về các thiết bị theo dõi sức khỏe tốt nhất, đồ chạy bộ (bao gồm giày và tất), và tai nghe tốt nhất.
📩 Nhận thêm nhiều thông tin nội bộ hơn nữa với bản tin hàng tuần của chúng tôi

Các câu hỏi thường gặp

Tại sao thuật toán nhận diện hình ảnh dễ bị tấn công bởi ví dụ phản đối?

Thuật toán nhận diện hình ảnh dễ bị tấn công bởi ví dụ phản đối vì chúng có thể bị đánh lừa khi những điểm ảnh nhỏ bị biến đổi, dẫn đến nhận diện sai các đối tượng trong bức ảnh.

Những rủi ro nào có thể phát sinh từ ví dụ phản đối trong AI?

Ví dụ phản đối có thể tạo ra rủi ro bảo mật, như làm cho ô tô tự lái bỏ qua biển cấm dừng hoặc khiến hệ thống nhận diện khuôn mặt nhận dạng sai người.

Các nhà nghiên cứu đã giải thích thế nào về việc nhận diện của AI?

Nghiên cứu cho thấy AI nhận diện các chi tiết nhỏ mà mắt người không thể thấy, dẫn đến hiện tượng gọi là ví dụ phản đối khi chúng không phù hợp với cách mà con người nhận thức.

Tại sao những đặc điểm không mạnh mẽ lại quan trọng trong AI?

Những đặc điểm không mạnh mẽ rất quan trọng vì chúng giúp AI phân loại chính xác hơn, mặc dù chúng ta không thể nhìn thấy những chi tiết này trong thế giới thực.

Những thách thức nào mà AI phải đối mặt trong việc giải thích quyết định của mình?

AI gặp khó khăn trong việc giải thích quyết định vì chúng dựa vào các mẫu mà con người không thể nhận biết, tạo ra những khó khăn trong việc chứng minh sự chính xác trước tòa.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]