

Nghiên cứu này đến đúng lúc. Dấu nước đã nổi lên như một trong những chiến lược hứa hẹn nhất để xác định hình ảnh và văn bản được tạo ra bởi trí tuệ nhân tạo. Giống như dấu nước vật lý được nhúng trên tiền giấy và tem để chứng minh tính xác thực, dấu nước số được thiết kế để theo dõi nguồn gốc của hình ảnh và văn bản trực tuyến, giúp mọi người phát hiện video deepfake và sách do bot sáng tác. Với cuộc bầu cử Tổng thống Hoa Kỳ sắp diễn ra vào năm 2024, lo ngại về phương tiện truyền thông bị làm giả là rất cao—và một số người đã bị đánh lừa. Cựu Tổng thống Hoa Kỳ Donald Trump, ví dụ, đã chia sẻ một video giả mạo về Anderson Cooper trên nền tảng Truth Social của mình; giọng nói của Cooper đã được sao chép bằng trí tuệ nhân tạo.
Trong mùa hè này, OpenAI, Alphabet, Meta, Amazon và một số đối tác trí tuệ nhân tạo lớn khác cam kết phát triển công nghệ đánh dấu nước để chống lại thông tin sai lệch. Vào cuối tháng 8, Google’s DeepMind phát hành phiên bản beta của công cụ đánh dấu nước mới của họ, SynthID. Hi vọng là những công cụ này sẽ đánh dấu nội dung trí tuệ nhân tạo ngay khi nó được tạo ra, giống như dấu nước vật lý xác nhận đô la khi chúng được in.
Đây là một chiến lược vững chắc, trực tiếp, nhưng có thể không phải là chiến thắng. Nghiên cứu này không phải là công việc duy nhất chỉ ra nhược điểm lớn của việc đánh dấu nước. “Đã được xác định rõ ràng rằng đánh dấu nước có thể bị tấn công,” nói Hany Farid, một giáo sư tại Trường Thông tin Đại học California, Berkeley.
Tháng 8 này, các nhà nghiên cứu tại Đại học California, Santa Barbara và Carnegie Mellon đã đồng sáng tác một bài báo khác trình bày những kết quả tương tự, sau khi tiến hành các cuộc tấn công thử nghiệm của riêng họ. “Tất cả các dấu nước vô hình đều có thể bị tấn công,” nó đọc. Nghiên cứu mới nhất này đi thậm chí xa hơn. Trong khi một số nhà nghiên cứu hy vọng rằng dấu nước có thể nhìn thấy (“độ chệch cao”) có thể được phát triển để chống lại các cuộc tấn công, Feizi và đồng nghiệm của ông nói rằng thậm chí loại có vẻ hứa hẹn này cũng có thể bị thao túng.
Nhược điểm của việc đánh dấu nước không làm cho các đại gia công nghệ từ bỏ nó nhưng những người làm việc trong lĩnh vực phát hiện trí tuệ nhân tạo đều đề phòng. “Ban đầu, việc đánh dấu nước nghe có vẻ là một giải pháp cao quý và hứa hẹn, nhưng các ứng dụng thực tế của nó thất bại ngay từ khi chúng có thể dễ dàng giả mạo, loại bỏ hoặc bị phớt lờ,” nói Ben Colman, CEO của công ty khởi nghiệp phát hiện trí tuệ nhân tạo Reality Defender.
“Đánh dấu nước không hiệu quả,” thêm Bars Juhasz, đồng sáng lập Undetectable, một công ty khởi nghiệp tận tụy giúp người ta né tránh các bộ dò trí tuệ nhân tạo. “Cả ngành công nghiệp, như của chúng tôi, đã nảy mọc để đảm bảo rằng nó không hiệu quả.” Theo Juhasz, các công ty như công ty anh ta đã có khả năng cung cấp dịch vụ loại bỏ dấu nước nhanh chóng.
Một số người nghĩ rằng việc đánh dấu nước có vai trò trong phát hiện trí tuệ nhân tạo—miễn là chúng ta hiểu rõ nhược điểm của nó. “Quan trọng là phải hiểu rằng không ai nghĩ rằng chỉ có đánh dấu nước sẽ đủ,” Farid nói. “Nhưng tôi tin rằng việc đánh dấu nước mạnh mẽ là một phần của giải pháp.” Ông nghĩ rằng việc cải tiến đánh dấu nước và sau đó sử dụng nó kết hợp với các công nghệ khác sẽ làm cho việc kẻ xấu khó có thể tạo ra những bản giả mạo thuyết phục.
Một số đồng nghiệp của Feizi cũng nghĩ rằng đánh dấu nước có đúng chỗ của nó. “Việc này có phải là một đòn mạnh vào đánh dấu nước phụ thuộc rất nhiều vào các giả định và hy vọng đặt vào đánh dấu nước như là một giải pháp,” Yuxin Wen, một sinh viên nghiên cứu tiến sĩ tại Đại học Maryland và đồng tác giả của một bài báo gần đây đề xuất một kỹ thuật đánh dấu nước mới. Đối với Wen và đồng tác giả của ông, bao gồm giáo sư khoa học máy tính Tom Goldstein, nghiên cứu này là cơ hội để xem xét lại những kỳ vọng đặt vào đánh dấu nước, thay vì là lý do để bác bỏ việc sử dụng nó như một công cụ xác thực trong số nhiều công cụ khác nhau.
“Luôn có những đối tượng tinh vi có khả năng né tránh phát hiện,” Goldstein nói. “Việc có một hệ thống chỉ có thể phát hiện một số điều là hoàn toàn chấp nhận được.” Ông xem đánh dấu nước như một hình thức giảm thiểu thiệt hại và hữu ích để bắt các nỗ lực cấp độ thấp trong việc làm giả mạo trí tuệ nhân tạo, ngay cả khi nó không thể ngăn chặn các cuộc tấn công cấp độ cao.
Sự giảm bớt kỳ vọng này có thể đã xảy ra. Trong bài đăng trên blog thông báo về SynthID, DeepMind cẩn trọng để bảo toàn lựa chọn của mình, lưu ý rằng công cụ “không hoàn toàn đảm bảo” và “không hoàn hảo.”
Feizi chủ yếu là một người hoài nghi về ý tưởng rằng việc đánh dấu nước là một cách sử dụng tốt các nguồn lực cho các công ty như Google. “Có lẽ chúng ta nên làm quen với việc chúng ta sẽ không thể đánh dấu một cách đáng tin cậy hình ảnh do trí tuệ nhân tạo tạo ra,” ông nói.
Tuy nhiên, bài báo của ông lạc quan hơn một chút trong các kết luận của nó. “Dựa trên kết quả của chúng tôi, việc thiết kế một dấu nước mạnh mẽ là một công việc khó khăn nhưng không nhất thiết là không thể,” nó đọc.
