Nguy cơ về tính minh bạch của AI trong nghiên cứu

Sự phát triển của GenAI đang làm tăng lo ngại về sự giả mạo trong các bài báo khoa học, đòi hỏi các chuyên gia phát triển công cụ phát hiện mới.

Theo tờ Nature, các nhà khoa học ngày càng quan ngại trước khả năng công nghệ trí tuệ nhân tạo tạo sinh (GenAI) có thể tạo ra các bài báo giả mạo, ảnh hưởng đến tính xác thực của các nghiên cứu khoa học.

Sự phát triển của những công cụ AI này khiến việc làm giả các hình ảnh, văn bản và dữ liệu khoa học ngày càng tinh vi hơn chỉ với chi phí rất rẻ. Chính điều này đã làm dấy lên lo ngại về những nguồn tài liệu khoa học thiếu tin cậy với những hình ảnh, bản thảo hay trích dẫn giả mạo.

BÀI VIẾT LIÊN QUAN

AI agent của Alibaba tự đào tài sản mã hóa và thiết lập đường hầm bí mật trong quá trình huấn luyện

Alchemy trao quyền tự chủ tài chính cho AI agent trên hơn 100 blockchain

Nghiên cứu cho thấy các mô hình AI ưu tiên Bitcoin hơn tiền pháp định và stablecoin

Stripe: blockchain cần 1 tỷ giao dịch mỗi giây cho kỷ nguyên tác nhân AI

Hiện tại, một cuộc chạy đua đang diễn ra khi các chuyên gia về tính toàn vẹn, các nhà xuất bản và các công ty công nghệ cố gắng phát triển các công cụ AI để nhanh chóng phát hiện các yếu tố giả mạo do AI tạo ra trong các bài báo.

Jana Christopher, một nhà phân tích tính toàn vẹn hình ảnh tại FEBS Press ở Heidelberg, Đức, cho biết: “Đây là một diễn biến đáng sợ. Nhưng cũng có những chuyên gia và các thay đổi mang tính cấu trúc được đề xuất để ứng phó với thách thức này.”

Các chuyên gia về tính toàn vẹn cho rằng, mặc dù nhiều tạp chí chấp nhận văn bản do GenAI tạo ra trong một số trường hợp nhất định, nhưng việc sử dụng các công cụ này để tạo ra hình ảnh hoặc dữ liệu khác vẫn ít được chấp nhận. Trong tương lai gần, văn bản do AI tạo ra có thể được chấp nhận, nhưng việc tạo dữ liệu vẫn còn nhiều tranh cãi.

Nhiều chuyên gia nghi ngờ rằng dữ liệu, bao gồm hình ảnh, được tạo ra bằng AI sinh tạo đã lan rộng trong các tài liệu khoa học và các nhà sản xuất hàng loạt bài báo đang tận dụng công cụ AI để sản xuất hàng loạt các bài báo.

Việc xác định hình ảnh được tạo ra bởi AI đặt ra một thách thức rất lớn. Hầu hết hình ảnh thường gần như không thể phân biệt với hình ảnh thực tế, ít nhất là bằng mắt thường.

Hình ảnh được tạo ra bằng Adobe Photoshop hoặc các công cụ tương tự trước khi xuất hiện GenAI thường chứa những dấu hiệu rõ ràng mà các chuyên gia có thể phát hiện, ví dụ như nền giống nhau hoặc sự vắng mặt bất thường của vết bẩn hay vết ố. Ngược lại, hình ảnh do AI tạo ra thường không có những dấu hiệu đó.

“Tôi thấy rất nhiều bài báo mà tôi nghĩ rằng, những đường Western blot này trông không thật — nhưng không có bằng chứng rõ ràng,” Elisabeth Bik, một chuyên gia pháp y hình ảnh và tư vấn tại San Francisco, California, nói. “Bạn chỉ có thể nói rằng chúng trông kỳ lạ, và điều đó tất nhiên không đủ bằng chứng để viết cho biên tập viên.”

Sự thật là đa số các lỗi mà các chuyên gia hiện tại phát hiện đều nằm trong các bài báo có tuổi đời cách đây vài năm – khi công nghệ AI còn chưa được phát triển. Điều đó cho thấy các công cụ GenAI hiện đang được cải thiện ngày càng ít lỗi hơn.

Việc tạo hình ảnh chất lượng bằng GenAI không khó. Kevin Patrick, một thám tử hình ảnh khoa học được biết đến với tên Cheshire trên mạng xã hội, đã chứng minh mức độ dễ dàng của việc này và đăng kết quả của mình trên X. Sử dụng công cụ AI Generative Fill của Photoshop, Patrick đã tạo ra các hình ảnh thực tế — có thể xuất hiện trong các bài báo khoa học — về khối u, nuôi cấy tế bào, Western blot và hơn thế nữa. Hầu hết các hình ảnh chỉ mất chưa đến một phút để sản xuất (xem ‘Generating bogus science’).

Một số nhà xuất bản cho biết họ đã tìm thấy bằng chứng về nội dung do GenAI trong các nghiên cứu đã công bố. Điều này bao gồm cả PLoS, đã nhận được thông tin về nội dung đáng ngờ và tìm thấy bằng chứng về văn bản và dữ liệu do AI tạo ra trong các bài báo và bài gửi thông qua các cuộc điều tra nội bộ.

Tuy nhiên, một số công cụ khác cũng có thể tạo điều kiện cho những người muốn tạo nội dung giả mạo. Ví dụ, một số công cụ AI tạo ra hình ảnh hiển vi độ phân giải cao, có thể dễ dàng bị lạm dụng để tạo ra hàng trăm hoặc hàng nghìn hình ảnh giả mạo.

Các công ty đang phát triển phần mềm để phát hiện hình ảnh được tạo ra bởi AI, như Imagetwin và Proofig, đang mở rộng phần mềm để loại bỏ các hình ảnh được tạo bởi AI sinh tạo. Do đó, các cơ sở dữ liệu hình ảnh được tạo bởi AI đang được xây dựng để đào tạo các thuật toán. Một số công cụ phát hiện AI đã có hiệu quả trong việc phát hiện hình ảnh giả mạo, tuy nhiên, đầu ra vẫn cần được đánh giá bởi các chuyên gia.

Các nhóm xuất bản cũng đang thực hiện các bước để giải quyết vấn đề hình ảnh do AI tạo ra. Các nhóm đang nỗ lực xây dựng cách thức xác minh dữ liệu thô, chẳng hạn như đánh dấu hình ảnh chụp từ kính hiển vi bằng các dấu nước mờ tương tự như cách được sử dụng trong văn bản AI sinh tạo.

Tóm lại, việc phát hiện hình ảnh giả mạo do AI tạo ra là một thách thức lớn, đòi hỏi sự hợp tác của nhiều bên, từ các nhà nghiên cứu, các nhà xuất bản đến các công ty công nghệ. Dù vậy, nỗ lực phát triển công cụ phát hiện đang ngày càng tích cực hơn.

Tags: AI