
Zoom, công ty đã làm cho việc tham gia cuộc họp kinh doanh trong bộ đồ ngủ của bạn trở nên bình thường, đã phải mở tiếng mình tuần này để đảm bảo người dùng rằng nó sẽ không sử dụng dữ liệu cá nhân để đào tạo trí tuệ nhân tạo mà không có sự đồng ý của họ.
Nội dung
Để tôn trọng sự ưa thích về quyền riêng tư của bạn, nội dung này chỉ có thể xem trên trang web xuất xứ.
Một người dùng tinh mắt trên Hacker News tuần trước nhận ra rằng một cập nhật vào điều khoản và điều kiện của Zoom vào tháng 3 có vẻ như bản thân công ty đã được tự do tuyên bố thu thập âm thanh, video và các dữ liệu khác, và đổ nó vào hệ thống học máy.

Các điều khoản mới quy định rằng khách hàng “đồng ý cho Zoom truy cập, sử dụng, thu thập, tạo ra, sửa đổi, phân phối, xử lý, chia sẻ, duy trì và lưu trữ Dữ liệu Tạo ra Bởi Dịch vụ” với mục đích bao gồm “máy học hoặc trí tuệ nhân tạo (bao gồm cả đào tạo và điều chỉnh của thuật toán và mô hình).”
Khám phá này đã khiến cho các bài viết tin tức kỳ cục và các bài đăng tức giận trên mạng xã hội. Sớm thôi, Zoom đã rút lại. Vào thứ Hai, Smita Hasham, Giám đốc sản phẩm chính của Zoom, viết một bài đăng trên blog cho biết, “Chúng tôi sẽ không sử dụng nội dung khách hàng audio, video hoặc chat để đào tạo các mô hình trí tuệ nhân tạo của chúng tôi mà không có sự đồng ý của bạn.” Công ty cũng cập nhật điều khoản của mình để nói cũng vậy.
Sau đó trong tuần, Zoom lại cập nhật điều khoản của mình một lần nữa, để làm rõ rằng nó sẽ không cung cấp "audio, video, chat, chia sẻ màn hình, tệp đính kèm hoặc các thông điệp khác như nội dung khách hàng (ví dụ như kết quả thăm dò ý kiến, bảng trắng và phản ứng)" cho các mô hình trí tuệ nhân tạo. Vera Ranneft, người phát ngôn cho công ty, nói rằng Zoom trước đây chưa từng sử dụng nội dung của khách hàng theo cách này.
Những cập nhật này có vẻ đủ an tâm, nhưng tất nhiên nhiều người dùng Zoom hoặc quản trị viên cho tài khoản doanh nghiệp có thể nhấp vào “Đồng ý” với các điều khoản mà không nhận ra đầy đủ về những gì họ đang gửi đi. Và nhân viên phải sử dụng Zoom có thể không biết về sự lựa chọn mà nhà tuyển dụng của họ đã đưa ra. Một luật sư chú ý rằng các điều khoản vẫn cho phép Zoom thu thập rất nhiều dữ liệu mà không cần sự đồng ý.
Cuộc rối này cho thấy sự thiếu hụt các biện pháp bảo vệ dữ liệu có ý nghĩa vào thời điểm mà sự bùng nổ của trí tuệ nhân tạo sinh sáng đã khiến ngành công nghiệp công nghệ đói khát dữ liệu hơn thậm chí còn nhiều hơn. Các công ty đã xem trí tuệ nhân tạo sinh sáng như một loại quái vật mà phải nuôi dưỡng bằng mọi cách—ngay cả khi không rõ chính xác rằng dữ liệu đó cần thiết cho mục đích gì hoặc hệ thống trí tuệ nhân tạo tương lai đó có thể làm gì.
Sự thăng tiến của các công cụ tạo ảnh trí tuệ nhân tạo như DALL-E 2 và Midjourny, tiếp theo là ChatGPT và các chatbot thông minh nhưng có khuyết điểm khác, đã trở nên khả thi nhờ vào lượng lớn dữ liệu đào tạo—nhiều phần bản quyền—đã được lấy từ web. Và tất cả các loại công ty hiện đang tìm cách sử dụng dữ liệu mà họ sở hữu hoặc được tạo ra bởi khách hàng và người dùng của họ để xây dựng các công cụ trí tuệ nhân tạo sáng tạo.
Zoom đã chính thức gia nhập vào cuộc đua của các công cụ sáng tạo. Tháng 6, công ty giới thiệu hai tính năng tạo văn bản để tóm tắt cuộc họp và soạn thảo email về cuộc họp đó. Zoom có thể sử dụng dữ liệu từ cuộc họp video của người dùng để phát triển thuật toán phức tạp hơn. Các thuật toán này có thể tóm tắt hoặc phân tích hành vi của cá nhân trong cuộc họp, hoặc có thể tạo ra một hình ảnh ảo cho ai đó mà kết nối tạm thời bị mất hoặc không có thời gian tắm.
Vấn đề của nỗ lực của Zoom để thu thập thêm dữ liệu là nó phản ánh tình trạng tổng quát về dữ liệu cá nhân của chúng ta. Nhiều công ty công nghệ đã kiếm lợi từ thông tin của chúng ta, và nhiều trong số chúng như Zoom đang tìm kiếm cách để có thêm dữ liệu cho các dự án trí tuệ nhân tạo sáng tạo. Và tuy nhiên, chính chúng ta, người dùng, phải cố gắng kiểm soát những gì họ đang làm.
“Các công ty rất khao khát thu thập càng nhiều dữ liệu càng tốt,” nói Janet Haven, giám đốc điều hành của viện nghệ Data and Society. “Đây là mô hình kinh doanh—thu thập dữ liệu và xây dựng sản phẩm xung quanh dữ liệu đó, hoặc bán dữ liệu đó cho các nhà môi giới dữ liệu.”
Mỹ thiếu một luật quyền riêng tư liên bang, khiến người tiêu dùng bị nhiều hơn so với người ở Liên minh châu Âu chịu đựng hậu quả của sự đói khát dữ liệu được truyền cảm hứng từ ChatGPT. Những đề xuất về luật, như Đạo luật Quyền riêng tư và Bảo vệ Dữ liệu của Mỹ, mang lại hy vọng về việc thiết lập các quy tắc liên bang chặt chẽ về việc thu thập và sử dụng dữ liệu, và Bảo chủ nghĩa về Trí tuệ Nhân tạo của chính phủ Biden cũng kêu gọi bảo vệ dữ liệu theo mặc định. Nhưng cho đến nay, sự phản kháng của công chúng như phản ứng với các động thái của Zoom vẫn là cách hiệu quả nhất để kiểm soát sự đói khát dữ liệu của các công ty. Thật không may, điều này không phải là một cơ chế đáng tin cậy để nắm bắt mọi quyết định đáng ngờ của các công ty cạnh tranh trong lĩnh vực Trí tuệ Nhân tạo.
Trong thời đại khi những công nghệ mới nhất và được đánh giá cao rộng rãi được xây dựng dựa trên núi dữ liệu được thu thập từ người tiêu dùng, thường là bằng cách không đạo đức, có vẻ như những biện pháp bảo vệ mới không thể đến đúng lúc. “Mỗi người đều được cho là phải đưa ra các biện pháp để bảo vệ bản thân mình,” Haven nói. “Điều này hoàn toàn trái ngược với ý tưởng rằng đây là một vấn đề xã hội.”
Cập nhật ngày 14-8-2023, 1:20 chiều EDT: Bài viết đã được cập nhật để phản ánh Zoom thực hiện thêm các thay đổi vào chính sách dữ liệu của mình.
Cập nhật ngày 10-8-2023, 7:15 chiều EDT: Bài viết đã được cập nhật với bình luận từ Zoom.
