Tòa án liên bang Hoa Kỳ phán quyết việc Meta sử dụng hàng triệu cuốn sách có bản quyền để huấn luyện mô hình Llama là “sử dụng hợp lý”.
Một tòa án liên bang tại Hoa Kỳ đã ra phán quyết rằng việc Meta Platforms Inc. sử dụng hàng triệu cuốn sách có bản quyền, bài báo học thuật và truyện tranh để huấn luyện các mô hình trí tuệ nhân tạo Llama là “sử dụng hợp lý” theo luật bản quyền Hoa Kỳ. Đây là một chiến thắng pháp lý quan trọng đối với các công ty công nghệ đang phát triển AI tạo sinh.
Vụ kiện được khởi xướng bởi một nhóm tác giả bao gồm Ta-Nehisi Coates và Richard Kadrey, cáo buộc gã khổng lồ truyền thông xã hội và AI trị giá 1,4 nghìn tỷ USD này đã sử dụng trái phép một kho nội dung khổng lồ trên internet để đào tạo AI mà không có sự cho phép. Các tác phẩm này được thu thập từ những kho lưu trữ như LibGen – một thư viện ngầm chuyên lưu trữ nội dung mà không có quyền từ nhà xuất bản.
Thẩm phán Liên bang Vince Chhabria tại San Francisco đứng về phía Meta, kết luận rằng các nguyên đơn không đưa ra được các lập luận pháp lý phù hợp để bảo vệ yêu cầu của mình. Ông nêu rõ trong phán quyết: “Phán quyết này không khẳng định rằng việc Meta sử dụng tài liệu có bản quyền để huấn luyện mô hình ngôn ngữ là hợp pháp. Nó chỉ thể hiện rằng các nguyên đơn đã sử dụng sai lập luận pháp lý và không xây dựng được hồ sơ bằng chứng hỗ trợ cho luận điểm đúng.”
Lập luận “tính chuyển đổi” của Meta được tòa án chấp nhận
Meta lập luận rằng hoạt động huấn luyện mô hình AI của họ là một hành vi mang tính chuyển đổi – một yếu tố cốt lõi trong chuẩn “fair use” theo luật bản quyền Hoa Kỳ – và rằng cách thức thu thập dữ liệu là không quan trọng. Tòa án đồng tình rằng bản chất chuyển đổi của công nghệ, cùng với việc các nguyên đơn thiếu lập luận phản biện thuyết phục, đã nghiêng cán cân có lợi cho Meta.
Phán quyết này được đưa ra chỉ vài ngày sau một thắng lợi pháp lý khác cho Anthropic, đơn vị phát triển mô hình ngôn ngữ Claude. Thẩm phán liên bang William Alsup tại San Francisco cho biết Anthropic đã sử dụng hợp lý các tác phẩm của các tác giả Andrea Bartz, Charles Graeber và Kirk Wallace Johnson để huấn luyện mô hình ngôn ngữ lớn Claude.
Ông Alsup so sánh việc Anthropic sử dụng sách như việc “một độc giả học viết văn”, người sử dụng tác phẩm “không phải để sao chép hay thay thế, mà để rẽ hướng và sáng tạo ra điều khác biệt”. Tuy nhiên, ông cũng khẳng định việc sao chép và lưu trữ hơn 7 triệu cuốn sách lậu trong một thư viện trung tâm là vi phạm bản quyền và không phải fair use, mặc dù công ty sau đó đã mua “hàng triệu” cuốn sách in để bù đắp.
Cuộc tranh luận pháp lý xoay quanh bản quyền trong kỷ nguyên AI ngày càng căng thẳng, khi các mô hình tạo sinh như ChatGPT dựa vào các tập dữ liệu cực lớn để học và sinh nội dung. Nhiều phần trong các tập dữ liệu này là tác phẩm có bản quyền, làm dấy lên lo ngại trong cộng đồng tác giả, nhà xuất bản và nghệ sĩ về việc bị sử dụng trái phép.
Mặc dù vụ kiện Meta được đánh giá là thắng lợi lớn cho Big Tech, Thẩm phán Chhabria cũng gợi ý những hướng tiếp cận pháp lý khả thi hơn cho các vụ kiện trong tương lai. Ông cho rằng một lập luận mạnh hơn có thể tập trung vào “sự suy giảm thị trường” – tức nguy cơ mà các nội dung do AI tạo ra có thể gây ra cho các tác phẩm gốc của con người. Quyết định này chắc chắn sẽ ảnh hưởng mạnh đến loạt vụ kiện đang diễn ra giữa giới sáng tạo và các công ty AI.