Reddit đang hạn chế truy cập dữ liệu cho các công cụ tìm kiếm, trừ khi họ đồng ý trả phí.
Trong vài tuần qua, nền tảng mạng xã hội nổi tiếng với lượng người dùng khổng lồ, Reddit, đang bắt đầu chặn các công cụ tìm kiếm truy cập vào các bài đăng hay bình luận trên đó, theo báo cáo từ 404 Media. Nền tảng chỉ cho phép những công cụ tìm kiếm đã trả phí truy cập nguồn dữ liệu của mình.
Trước mắt chỉ Google mới hiển thị kết quả tìm kiếm mới nhất khi người dùng tìm kiếm nội dung trên Reddit bằng cú pháp “site:reddit.com”. Điều này loại trừ Bing, DuckDuckGo và các công cụ tìm kiếm thay thế khác, rất có thể là do Google đã ký kết thỏa thuận trị giá 60 triệu USD cho phép công ty huấn luyện các mô hình AI của mình trên nội dung từ Reddit.
Phát ngôn viên Reddit, ông Tim Rathschmidt, khẳng định với The Verge rằng động thái này không liên quan đến thỏa thuận hợp tác AI gần đây với Google.
Ông cho biết Reddit đã đàm phán với nhiều công cụ tìm kiếm nhưng không đạt được sự đồng thuận chung với tất cả, do một số bên không đưa ra cam kết rõ ràng về việc sử dụng dữ liệu, bao gồm cả việc huấn luyện AI.
Trước đó, Reddit đã cập nhật tệp robots.txt để hạn chế hoạt động thu thập dữ liệu trái phép.
“Đây là tín hiệu cho những ai chưa có thỏa thuận với chúng tôi rằng họ không được phép truy cập dữ liệu Reddit”, Ben Lee, Giám đốc pháp chế của Reddit, chia sẻ. Microsoft xác nhận Bing đã ngừng thu thập dữ liệu Reddit kể từ ngày 1/7, khi nền tảng này cập nhật tệp robots.txt.
Quyết định ngăn sóng công cụ tìm kiếm của Reddit được xem là táo bạo nhưng không quá bất ngờ. Trong năm qua, Reddit đã chủ động hơn trong việc bảo vệ dữ liệu của mình, nhằm tìm kiếm nguồn thu mới và xoa dịu các nhà đầu tư.
Trước đó, Reddit đã tăng phí API cho các nhà phát triển bên thứ ba và thậm chí dọa sẽ chặn cả Google nếu không trả tiền bản quyền dữ liệu huấn luyện AI.
Trong bối cảnh chatbot AI tràn lan trên Internet với nội dung khó kiểm soát, việc tìm kiếm thông tin từ người dùng thực ngày càng quan trọng. Giờ đây, người dùng chỉ có thể tìm kiếm thông tin trên Reddit thông qua Google hoặc các công cụ dựa trên Google.