Trong bối cảnh trí tuệ nhân tạo (AI) phát triển vũ bão, nghiên cứu của Google DeepMind đề xuất những yếu tố quan trọng để đạt được siêu trí tuệ nhân tạo (ASI).
Những năm gần đây, các mô hình nền tảng đã đạt được tiến bộ vượt bậc và được sử dụng rộng rãi trong nhiều ứng dụng. Tuy nhiên, việc tạo ra các hệ thống trí tuệ nhân tạo (AI) mở đầu, có khả năng tự cải thiện và liên tục tạo ra thông tin mới, vẫn còn là thách thức lớn. Bài báo cáo của Edward Hughes và các đồng tác giả chỉ ra tính chất mở (open-ended) có tác động thế nào tới việc phát triển lên ASI, và làm sao đạt được tính chất ấy trong các hệ thống AI hiện nay.
Định nghĩa chính thức về tính chất mở được đưa ra dựa trên hai khía cạnh chính là sự mới mẻ và khả năng học hỏi. Một hệ thống được coi là có tính chất mở nếu nó liên tục tạo ra các dữ liệu mới mẻ có giá trị học hỏi nhằm cải thiện hiểu biết và kỹ năng của đối tượng quan sát.
Bài báo cung cấp nhiều ví dụ cụ thể về các hệ thống AI hiện tại để minh họa cho khái niệm này. AlphaGo là một ví dụ điển hình về hệ thống có tính chất mở trong phạm vi hẹp. AlphaGo đã vượt qua trình độ của các người chơi cờ vây hàng đầu thế giới bằng cách phát triển những chiến lược mới mẻ, khó đoán trước. Tuy nhiên, tính chất mở của AlphaGo chỉ giới hạn trong phạm vi trò chơi cờ vây.
Một ví dụ khác là hệ thống AdA, một tác nhân học tập trong môi trường 3D XLand2 với 25 tỷ biến thể nhiệm vụ. AdA có khả năng tích lũy các kỹ năng phức tạp và đa dạng, nhưng tính mới mẻ của nó có xu hướng giảm dần sau một thời gian đào tạo. Điều này cho thấy rằng để duy trì tính chất mở, cần có một môi trường phong phú hơn và tác nhân mạnh mẽ hơn.
Bài báo cũng thảo luận về các hệ thống tiến hóa như POET (Paired open-ended trailblazer), nơi các tác nhân và môi trường cùng tiến hóa. POET minh họa hiện tượng “stepping stone” (bước đệm), nơi các tác nhân có thể giải quyết các môi trường rất thách thức thông qua sự tiến hóa dần dần. Tuy nhiên, các hệ thống này cũng gặp giới hạn khi môi trường không đủ phức tạp để duy trì tính chất mở.
Ngoài ra, bài báo còn nêu rõ rằng các mô hình nền tảng hiện tại không đáp ứng đủ tiêu chí của tính chất mở khi chỉ được huấn luyện trên các tập dữ liệu cố định. Các mô hình này có thể cho thấy tính chất mở trong các lĩnh vực rộng lớn, nhưng khi thu hẹp phạm vi, chúng lộ rõ các hạn chế về khả năng tạo ra các giải pháp mới và chính xác.
Các tác giả đề xuất bốn hướng nghiên cứu chính để kết hợp tính chất mở với các mô hình nền tảng: học tăng cường (RL), tự cải thiện, tạo nhiệm vụ và các thuật toán tiến hóa. Học tăng cường đã đạt được nhiều thành công trong các lĩnh vực hẹp, và các mô hình như Voyager đã cho thấy tiềm năng tự cải thiện bằng cách xây dựng một thư viện kỹ năng từ các nhiệm vụ liên tục được cải tiến. Các thuật toán tiến hóa cũng cung cấp một con đường hứa hẹn để tạo ra các hệ thống mở, với khả năng thực hiện các đột biến có ý nghĩa thông qua văn bản.
Một phần quan trọng của bài báo là thảo luận về các vấn đề an toàn và trách nhiệm khi phát triển các hệ thống mở. Tính chất mở mang lại nhiều rủi ro an toàn, bao gồm sự hiểu sai mục tiêu và lạm dụng thông số kỹ thuật. Việc đảm bảo rằng các hệ thống mở có thể được lý giải và điều khiển trong tay con người là rất quan trọng. Điều này đòi hỏi các hệ thống phải có khả năng giải thích và tương tác với con người một cách rõ ràng và dễ hiểu.
Trong báo cáo, các tác giả khẳng định rằng các mô hình nền tảng hiện tại đã đạt được nhiều tiến bộ đáng kể, nhưng để tiến tới ASI, cần phải phát triển các hệ thống có tính chất mở. Những hệ thống này có thể mang lại nhiều lợi ích to lớn cho xã hội, bao gồm việc đẩy nhanh các đột phá khoa học và công nghệ, nâng cao sáng tạo của con người và mở rộng kiến thức tổng quát trên nhiều lĩnh vực.
Bài báo của Google DeepMind đã mở ra một hướng đi mới trong nghiên cứu AI, nhấn mạnh tầm quan trọng của tính chất mở trong việc đạt được trí tuệ siêu phàm nhân tạo. Việc phát triển các hệ thống này một cách có trách nhiệm sẽ giúp đảm bảo rằng chúng mang lại lợi ích tối đa cho xã hội, đồng thời giảm thiểu các rủi ro tiềm tàng.