Tập đoàn công nghệ Trung Quốc Baidu đã ngăn chặn Google và Bing khỏi việc truy cập dữ liệu của dịch vụ tra cứu thông tin tương tự Wikipedia tại đại lục.
Theo SCMP, từ ngày 8/8, Baidu đã phát hành bản cập nhật nhằm chặn các bot khai thác thông tin của Google và Bing truy cập vào một phần của dịch vụ Baidu Baike (dịch vụ lưu trữ và tra cứu thông tin tương tự Wikipedia) tại Trung Quốc.
Baidu Baike là kho dữ liệu trực tuyến với khoảng 30 triệu mục. Việc ngăn chặn truy cập của Google và Microsoft cho thấy Baidu đang cố gắng bảo vệ tài sản số trong bối cảnh nhu cầu dữ liệu để đào tạo AI ngày càng gia tăng.
Trước đây, Reddit cũng đã thực hiện bước tương tự bằng cách chặn nhiều công cụ tìm kiếm (ngoại trừ Google). Google đã đạt thỏa thuận trị giá hàng triệu USD để khai thác thông tin từ Reddit nhằm huấn luyện mô hình AI.
Năm ngoái, Microsoft đã đe dọa cắt quyền truy cập vào dữ liệu tìm kiếm của mình nếu các công cụ tìm kiếm đối thủ tiếp tục sử dụng tài nguyên này cho chatbot và GenAI.
Hơn hai năm sau khi ra mắt, nhiều công ty phát triển AI hàng đầu trên toàn cầu đang tìm kiếm các thỏa thuận với các nhà xuất bản nội dung để có thể truy cập vào dữ liệu chất lượng cho các dự án GenAI.
Ví dụ, vào tháng 6, OpenAI đã ký hợp đồng với tạp chí Time của Mỹ, cho phép họ truy cập toàn bộ nội dung đã được lưu trữ trong hơn 100 năm của ấn phẩm này.