ChatGPT đang tạo ra sự chú ý toàn cầu. Trong hai tháng kể từ khi ra mắt, ứng dụng dựa trên Trí tuệ nhân tạo (AI) này đã thu hút 100 triệu người dùng tích cực, khiến cho ChatGPT trở thành ứng dụng phát triển nhanh nhất từng được tung ra.
Người dùng bị cuốn hút bởi những tính năng nổi bật của ChatGPT, song đồng thời cũng lo lắng về khả năng gây gián đoạn trong các lĩnh vực khác nhau.
Tuy nhiên, các nhà quan sát lưu ý rằng còn một vấn đề chưa được thảo luận nhiều: những nguy cơ liên quan đến quyền riêng tư mà ChatGPT có thể gây ra cho mỗi người dùng Internet - được thúc đẩy bởi dữ liệu cá nhân của họ.

Biểu tượng công cụ ChatGPT do công ty OpenAI phát triển. Ảnh: AFP/TTXVN
300 tỷ từ: Của ai và cho ai?
ChatGPT sử dụng một mô hình ngôn ngữ lớn đòi hỏi lượng dữ liệu lớn để hoạt động và tự cải thiện. Mô hình càng được huấn luyện trên nhiều dữ liệu thì càng có khả năng phát hiện các mẫu tốt hơn, dự đoán điều gì sẽ xảy ra tiếp theo và tạo ra văn bản một cách hợp lý.
OpenAI, công ty đứng sau ChatGPT, đã cung cấp cho công cụ này khoảng 300 tỷ từ được thu thập một cách có hệ thống từ Internet: sách, bài báo, trang web và bài đăng - bao gồm cả thông tin cá nhân thu được mà không có sự đồng ý của người dùng.
Nếu bạn từng viết một bài đăng trên blog, đánh giá sản phẩm hay nhận xét về một bài báo trực tuyến, rất có thể thông tin này đã được ChatGPT sử dụng.
Vấn đề là gì?
Trước hết, không ai trong số người dùng Internet được OpenAI xin phép sử dụng dữ liệu của họ. Đây rõ ràng là hành vi vi phạm quyền riêng tư, đặc biệt khi những dữ liệu nhạy cảm có thể được sử dụng để nhận dạng người dùng, thành viên gia đình hoặc vị trí của họ.
Ngay cả đối với những dữ liệu được công khai, việc OpenAI sử dụng chúng vẫn có thể vi phạm tính toàn vẹn của văn bản. Đây là một nguyên tắc cơ bản trong các cuộc thảo luận pháp lý về quyền riêng tư, theo đó thông tin của các cá nhân không được tiết lộ bên ngoài bối cảnh gốc của chúng.
Hơn nữa, OpenAI không cung cấp bất cứ quy trình nào cho phép cá nhân kiểm tra xem công ty có lưu trữ thông tin riêng tư của họ không, hay yêu cầu xóa những dữ liệu đó. “Quyền được lãng quên” này đặc biệt quan trọng trong trường hợp thông tin không chính xác hoặc gây hiểu lầm, và nó được đảm bảo theo Quy định bảo vệ dữ liệu chung của châu Âu (GDPR). Thậm chí, đang có những tranh luận về việc liệu ChatGPT có tuân thủ các yêu cầu của GDPR hay không.
Ngoài ra, những dữ liệu được OpenAI khai thác để đào tạo ChatGPT có thể là tài sản độc quyền hoặc có bản quyền như các cuốn tiểu thuyết, kịch bản phim, thơ văn, tài liệu nghiên cứu... ChatGPT không xem xét việc bảo vệ bản quyền khi tạo nội dung đầu ra, khiến bất kỳ ai sử dụng kết quả do ứng dụng này cung cấp đều có thể vô tình đạo văn.
Cuối cùng, OpenAI không trả tiền cho những dữ liệu họ thu thập được từ Internet. Các cá nhân, chủ sở hữu trang web và công ty sản xuất những nội dung, dữ liệu này không được chi trả xứng đáng. Điều này đặc biệt đáng chú ý khi OpenAI gần đây vừa công bố ChatGPT Plus, gói đăng ký trả phí sẽ cung cấp cho khách hàng quyền truy cập liên tục vào công cụ, với thời gian phản hồi nhanh hơn và ưu tiên tiếp cận các tính năng mới. Kế hoạch này dự kiến sẽ đóng góp doanh thu 1 tỷ USD cho OpenAI vào năm 2024.
Chính sách bảo mật mong manh
Một rủi ro khác về quyền riêng tư liên quan đến dữ liệu được cung cấp cho ChatGPT là dưới dạng yêu cầu của người dùng. Khi một người yêu cầu công cụ này trả lời các câu hỏi hoặc thực hiện các tác vụ nhất định, họ có thể vô tình chuyển giao các thông tin nhạy cảm và đưa chúng vào phạm vi tiếp cận công cộng.
Chẳng hạn, một luật sư có thể yêu cầu ChatGPT xem lại bản thảo thỏa thuận ly hôn, hoặc một lập trình viên có thể yêu cầu công cụ kiểm tra một đoạn mã. Thỏa thuận và đoạn mã - cùng với kết quả được xuất ra - sẽ thành một phần trong cơ sở dữ liệu của ChatGPT. Điều này đồng nghĩa chúng có thể được sử dụng để đào tạo thêm công cụ và được đưa vào phản hồi yêu cầu của người khác.
Ngoài điều này, OpenAI còn thu thập nhiều loại thông tin người dùng khác. Theo chính sách quyền riêng tư của công ty, ChatGPT cũng thu thập địa chỉ IP của người dùng, loại trình duyệt và cài đặt, cũng như dữ liệu về tương tác của người dùng với trang web - bao gồm loại nội dung mà người dùng tương tác, tính năng họ sử dụng và hành động họ thực hiện.
ChatGPT cũng thu thập thông tin về các hoạt động duyệt web của người dùng theo thời gian và trên các trang web khác nhau. Đáng báo động hơn, OpenAI có thể chia sẻ thông tin cá nhân của người dùng với các bên thứ ba không xác định mà không cần thông báo để đáp ứng các mục tiêu kinh doanh của họ.
Một số chuyên gia tin rằng ChatGPT là điểm bước ngoặt của AI - sự hiện thực hóa những thành tựu công nghệ để cách mạng hóa phương thức làm việc, học tập, viết và thậm chí là suy nghĩ của con người. Bất chấp những lợi ích tiềm năng của ChatGPT, cần nhớ rằng OpenAI là một công ty tư nhân hoạt động vì lợi nhuận. Lợi ích và mục tiêu thương mại của họ không nhất thiết phù hợp với nhu cầu chung của xã hội.
Nhận thức về các nguy cơ về quyền riêng tư khi sử dụng ChatGPT là điều cần phải được nhắc nhở đối với cộng đồng toàn cầu. Với vai trò là người tiêu dùng ngày càng sử dụng nhiều công nghệ AI hơn, chúng ta cần phải cực kỳ cẩn trọng về việc chia sẻ thông tin cá nhân với các công cụ như vậy.
