Amazon đẩy mạnh cuộc đua AI với Nova Act – siêu trợ lý có khả năng điều hướng web, đạt điểm hiệu suất 94% trên ScreenSpot, vượt trội so với đối thủ.
Trong động thái mới nhất nhằm giành lại vị thế trong lĩnh vực trí tuệ nhân tạo, Amazon vừa chính thức ra mắt Nova Act – siêu trợ lý AI (AI agent) có khả năng điều khiển trình duyệt web và thực hiện các tác vụ tự động. Sản phẩm được phát triển bởi phòng thí nghiệm AGI (Artificial General Intelligence) tại San Francisco, dưới sự dẫn dắt của David Luan và Pieter Abbeel – hai nhân vật từng thành lập startup riêng trước khi được Amazon chiêu mộ.
Đi kèm với siêu trợ lý này là Nova Act SDK, bộ công cụ phát triển cho phép các lập trình viên xây dựng nguyên mẫu AI agent sử dụng nền tảng của Amazon. Bộ công cụ này có thể truy cập qua trang web nova.amazon.com, nơi cũng giới thiệu các mô hình Nova khác của công ty.
Cuộc đua siêu trợ lý AI đang nóng lên
Nova Act là câu trả lời trực tiếp của Amazon đối với Operator của OpenAI và Computer Use của Anthropic (Claude). Mặc dù không phải là công ty đầu tiên tham gia cuộc đua này, Amazon có lợi thế đáng kể thông qua hệ sinh thái Alexa – trợ lý giọng nói đã hiện diện trong hàng triệu gia đình.
“Chúng tôi thiết kế Nova Act SDK để tự động hóa đáng tin cậy các tác vụ ngắn, đơn giản và cung cấp công cụ xác định thời điểm cần sự can thiệp của con người,” Luan chia sẻ với TechCrunch.
Theo dữ liệu nội bộ, Nova Act đạt 94% trên ScreenSpot Web Text – thang đo đánh giá khả năng tương tác với văn bản trên màn hình, vượt trội so với CUA của OpenAI (88%) và Claude 3.7 Sonnet của Anthropic (90%). Tuy nhiên, Amazon không công bố kết quả đánh giá trên WebVoyager – tiêu chuẩn phổ biến hơn trong ngành.
Siêu trợ lý của Amazon có thể thực hiện các tác vụ như đặt món salad từ Sweetgreen, đặt bàn ăn tối, điền biểu mẫu hoặc chọn ngày trên lịch thay mặt người dùng. Đây được xem là công nghệ nền tảng cho phiên bản Alexa+ sắp ra mắt – bản nâng cấp tích hợp AI tạo sinh cho trợ lý giọng nói.
Luan định nghĩa tham vọng AGI của Amazon là “hệ thống AI có thể giúp bạn làm bất cứ điều gì con người làm trên máy tính”. Dù vậy, phiên bản Nova Act hiện tại vẫn được công ty mô tả là “thô sơ” và chỉ là “bản xem trước dành cho nghiên cứu”.