Việc xóa và tái tạo dữ liệu không chỉ gây ảnh hưởng trực tiếp đến hoạt động mà còn đòi hỏi OpenAI phải chi một khoảng thời gian dài để huấn luyện lại trí tuệ nhân tạo.
OpenAI, công ty phát triển ChatGPT, có thể phải tiến hành xoá sạch toàn bộ dữ liệu và bắt đầu lại từ đầu.
Theo Arsc Techina, việc xóa toàn bộ dữ liệu có thể liên quan đến một vụ kiện của New York Times. Cũng chính vụ việc này khiến OpenAI bị phạt tới 150.000 USD cho mỗi phần tài liệu có bản quyền được sử dụng để đào tạo mô hình ngôn ngữ.
Việc reset dữ liệu và huấn luyện lại có thể ảnh hưởng lớn đến hiệu suất của OpenAI trong một thời gian dài.
Theo nguồn tin, NYT đang lo ngại về việc ứng dụng của trí tuệ nhân tạo trong các công cụ tìm kiếm. Nếu AI có thể tóm tắt nội dung từ các bài báo thay vì đưa người dùng đến trang web của NYT, điều này có thể làm giảm lượng truy cập trên trang web của nhà xuất bản.
NYT không phải là người đầu tiên kiện một công ty trí tuệ nhân tạo. Trước đó, Getty Images đã kiện Stability AI vì sử dụng ảnh từ Getty mà không được sự cho phép. Tuy nhiên, thay vì đòi bồi thường, Getty Images muốn Stability AI tôn trọng quyền sở hữu trí tuệ và xây dựng lại mô hình của họ.
Một vụ kiện tập thể đã được nêu lên chống lại OpenAI, cáo buộc ChatGPT đã thu thập dữ liệu từ hàng triệu người dùng mà không có sự đồng ý trước. Thông tin này được thu thập từ nhiều ứng dụng bên thứ ba như Spotify, Microsoft Teams và Snapchat, cùng với nhiều ứng dụng khác.
Hiện tại, New York Times và OpenAI đang tham gia vào cuộc đàm phán để đạt được thoả thuận cho phép OpenAI huấn luyện mô hình GPT từ tài liệu được NYT xuất bản. Điều này liên quan đến quyết định cấm của tờ báo này đối với OpenAI vào đầu tháng.