Microsoft đang phát triển công nghệ ước tính ảnh hưởng của dữ liệu huấn luyện cụ thể đối với đầu ra từ mô hình AI, trong bối cảnh gia tăng các thách thức pháp lý về quyền sở hữu trí tuệ.
Microsoft đang triển khai một dự án nghiên cứu mới nhằm phát triển phương pháp đánh giá và ghi nhận tác động của từng phần dữ liệu huấn luyện đối với nội dung do AI tạo ra, theo thông tin từ một thông báo tuyển dụng gần đây được lan truyền trên LinkedIn.
Dự án, được mô tả là “nguồn gốc thời gian huấn luyện”, đang tìm kiếm các thực tập sinh nghiên cứu để chứng minh rằng các mô hình AI có thể được huấn luyện theo cách giúp ước tính hiệu quả tác động của dữ liệu cụ thể (như ảnh và sách) đối với đầu ra của chúng.
Tìm giải pháp cho tranh chấp bản quyền ngày càng gia tăng
Sáng kiến này xuất hiện trong bối cảnh Microsoft đang phải đối mặt với các thách thức pháp lý về quyền sở hữu trí tuệ. Gã khổng lồ công nghệ đang bị kiện bởi The New York Times về cáo buộc vi phạm bản quyền khi sử dụng hàng triệu bài báo để huấn luyện mô hình AI, cũng như đối mặt với vụ kiện từ các nhà phát triển phần mềm liên quan đến GitHub Copilot.
Theo mô tả trong thông báo tuyển dụng, dự án này có tiềm năng tạo ra cơ chế “khuyến khích, công nhận và có khả năng trả tiền cho những người đóng góp dữ liệu có giá trị” cho các mô hình AI tương lai.
Jaron Lanier, nhà khoa học liên ngành tại Microsoft Research, được cho là có liên quan đến dự án này. Lanier trước đây đã viết về khái niệm “phẩm giá dữ liệu” – ý tưởng kết nối nội dung kỹ thuật số với những người sáng tạo ra nó và xác định những đóng góp “độc đáo và có ảnh hưởng nhất” khi một mô hình AI tạo ra nội dung có giá trị.
Trong khi các công ty như Bria, Adobe và Shutterstock đã triển khai một số hình thức bồi thường cho người đóng góp dữ liệu, hầu hết các phòng thí nghiệm AI lớn chủ yếu tập trung vào việc ký kết thỏa thuận cấp phép với các nhà xuất bản và nền tảng, hoặc cung cấp các cơ chế “từ chối” thường phức tạp và không áp dụng hồi tố.
Dự án của Microsoft có thể chỉ là một bằng chứng về khái niệm, tương tự như công nghệ mà OpenAI đã công bố đang phát triển vào năm ngoái nhưng vẫn chưa ra mắt. Tuy nhiên, việc Microsoft tập trung vào theo dõi dữ liệu huấn luyện là đáng chú ý, đặc biệt khi các phòng thí nghiệm AI khác như Google và OpenAI đang vận động để làm suy yếu các biện pháp bảo vệ bản quyền liên quan đến phát triển AI.