Nghiên cứu mới cho thấy ngay cả những mô hình AI tạo sinh tiên tiến nhất hiện nay cũng chỉ có thể tạo ra văn bản đáng tin cậy khoảng 35% thời gian.
Nghiên cứu được thực hiện bởi các nhà khoa học từ Đại học Cornell, Đại học Washington, Đại học Waterloo và viện nghiên cứu AI2, đã đánh giá khả năng tạo ra thông tin chính xác của hơn 12 mô hình AI phổ biến, bao gồm GPT-4o của OpenAI, Gemini của Google và Claude của Anthropic.
Kết quả cho thấy, không có mô hình nào thực sự vượt trội trong việc cung cấp thông tin chính xác trên tất cả các lĩnh vực. Các mô hình thường gặp khó khăn khi trả lời những câu hỏi không có sẵn trên Wikipedia, cho thấy sự phụ thuộc lớn vào nguồn dữ liệu này.
Nghiên cứu cũng chỉ ra rằng kích thước mô hình không phải là yếu tố quyết định khả năng tạo ra thông tin chính xác. Các mô hình nhỏ gọn như Claude 3 Haiku cũng gặp phải vấn đề sai lệch thông tin với tần suất tương đương các mô hình lớn hơn.
Các nhà nghiên cứu cho rằng, một trong những nguyên nhân dẫn đến vấn đề này là do chính nguồn dữ liệu huấn luyện AI, vốn được tạo bởi con người, cũng có thể chứa đựng thông tin chưa đúng.
Hiện tại, các nhà phát triển đang tìm cách hạn chế vấn đề bằng cách lập trình cho mô hình từ chối trả lời những câu hỏi không chắc chắn. Tuy nhiên, giải pháp này có thể làm giảm tính hữu dụng của AI.
Nghiên cứu kết luận rằng, cần có thêm nhiều nỗ lực nghiên cứu để giải quyết triệt để vấn đề cung cấp thông tin sai lệch trong AI tạo sinh. Bên cạnh đó, việc kiểm tra và xác minh thông tin do AI tạo ra bởi con người vẫn đóng vai trò quan trọng trong việc đảm bảo độ chính xác của thông tin.
Theo dõi Tin tức AI để không bỏ lỡ bất kỳ diễn biến mới nhất về AI tại Diễn đàn phổ cập Blockchain.