Meta xác nhận sẽ sử dụng nội dung công khai trên Facebook và Instagram để huấn luyện các mô hình AI tại EU sau khi tạm dừng kế hoạch này trước đó do áp lực từ cơ quan quản lý về quyền riêng tư.
Tập đoàn Meta vừa thông báo sẽ bắt đầu sử dụng nội dung công khai từ người dùng tại Liên minh châu Âu (EU) để huấn luyện các mô hình AI của mình từ tuần này. Đây là bước đi quan trọng sau khi công ty đã phải tạm dừng kế hoạch này vào tháng 6/2024 do áp lực từ Ủy ban Bảo vệ Dữ liệu Ireland (DPC) – cơ quan quản lý Meta tại EU.
Thông báo được đưa ra sau khi phiên bản giới hạn của Meta AI ra mắt tại EU vào tháng trước, muộn hơn nhiều so với thị trường Mỹ và các khu vực khác trên thế giới. Trong khi Meta đã huấn luyện AI trên nội dung người dùng tại Mỹ từ nhiều năm nay, công ty đã gặp phải sự phản đối tại EU do quy định nghiêm ngặt về quyền riêng tư, đặc biệt là Quy định Bảo vệ Dữ liệu Chung (GDPR).
Tuân thủ quy định và bảo vệ quyền riêng tư
“Năm ngoái, chúng tôi đã trì hoãn việc huấn luyện các mô hình ngôn ngữ lớn bằng nội dung công khai trong khi các cơ quan quản lý làm rõ các yêu cầu pháp lý,” Meta cho biết trong bài đăng trên blog. “Chúng tôi hoan nghênh ý kiến của EDPB (Ủy ban Bảo vệ Dữ liệu châu Âu) vào tháng 12, khẳng định rằng phương pháp ban đầu của chúng tôi đáp ứng các nghĩa vụ pháp lý.”
Từ tuần này, người dùng tại EU sẽ bắt đầu nhận được thông báo trong ứng dụng và email giải thích về việc Meta sẽ sử dụng dữ liệu công khai và tương tác với Meta AI để huấn luyện các mô hình của mình. Những thông báo này sẽ bao gồm liên kết đến biểu mẫu cho phép người dùng từ chối việc dữ liệu của họ được sử dụng.
Meta khẳng định không sử dụng tin nhắn riêng tư, cũng như dữ liệu công khai từ người dùng dưới 18 tuổi tại EU để huấn luyện các mô hình của mình. Công ty cũng nhấn mạnh tầm quan trọng của việc huấn luyện các mô hình AI trên đa dạng dữ liệu để hiểu được sự phức tạp và đa dạng của các cộng đồng châu Âu, bao gồm phương ngữ, kiến thức địa phương và cách sử dụng hài hước, châm biếm khác nhau.
Meta cho biết họ đang làm theo ví dụ từ các công ty như Google và OpenAI, cả hai đều đã sử dụng dữ liệu từ người dùng châu Âu để huấn luyện các mô hình AI của họ. Trong khi đó, DPC vẫn tiếp tục giám sát cách các nhà phát triển mô hình ngôn ngữ lớn huấn luyện dịch vụ AI của họ, mới đây nhất là thông báo điều tra việc huấn luyện Grok của xAI.