Anthropic đánh giá nguy cơ mới từ AI thế hệ mới

Anthropic cung cấp nhiều phát hiện mới về khả năng phá hoại tiềm ẩn của các hệ thống AI thế hệ mới trong nghiên cứu gần đây.