Copilot giờ đây có thể đặt vé, đặt bàn nhà hàng và ghi nhớ sở thích cá nhân, trở thành đối thủ đáng gờm với ChatGPT và Gemini.
Nhân dịp kỷ niệm 50 năm thành lập, Microsoft vừa công bố loạt tính năng mới đáng chú ý cho Copilot – trợ lý AI chủ lực của họ, mở rộng đáng kể khả năng tương tác và tự hành trên các nền tảng số. Sự nâng cấp này đánh dấu bước chuyển quan trọng khi tập đoàn phần mềm lớn nhất thế giới đang cân nhắc giảm sự phụ thuộc vào công nghệ của OpenAI.
Tính năng “agent” và khả năng tự hành trên web
Điểm nhấn trong đợt cập nhật này là khả năng tương tác trực tiếp với “hầu hết các trang web”, cho phép Copilot thực hiện các thao tác phức tạp như đặt vé, đặt bàn nhà hàng hay tìm kiếm ưu đãi – tương tự như tính năng Operator của OpenAI. Microsoft đã hợp tác với nhiều đối tác lớn trong ngày ra mắt, bao gồm Booking.com, Expedia, Kayak, OpenTable, Tripadvisor và các nền tảng du lịch, đặt phòng hàng đầu khác.
Người dùng chỉ cần nhập yêu cầu đơn giản, chẳng hạn “gửi một bó hoa cho bạn đời của tôi”, và Copilot sẽ tự động thực hiện nhiệm vụ đó. Ngoài ra, trợ lý AI của Microsoft còn có thể theo dõi các ưu đãi trực tuyến, thông báo cho người dùng khi có giảm giá và cung cấp liên kết để mua hàng – một tính năng lấy cảm hứng từ công cụ tìm kiếm Perplexity.
Tuy nhiên, Microsoft chưa công bố chi tiết về cơ chế hoạt động của khả năng này, cũng như dữ liệu về những tình huống mà Copilot có thể gặp khó khăn hoặc cần sự can thiệp của con người. Các chuyên gia trong ngành dự đoán rằng các trang web có thể sẽ chặn Copilot, tương tự như cách họ đã chặn Operator của OpenAI, nếu lo ngại việc giảm lượt truy cập trực tiếp có thể ảnh hưởng đến doanh thu quảng cáo.
Bên cạnh đó, Copilot giờ đây có thể tạo “podcast” tự động, với cuộc đối thoại qua lại giữa hai người dẫn chương trình tổng hợp, tương tự như tính năng Audio Overviews trong NotebookLM của Google. Người dùng có thể ngắt lời và đặt câu hỏi bất cứ lúc nào, và các host ảo sẽ ghi nhận và phản hồi.
Trên nền tảng di động, Copilot đã được tích hợp khả năng nhận diện hình ảnh thông qua camera điện thoại hoặc thư viện ảnh, cho phép người dùng đặt câu hỏi về những gì họ thấy. Trên Windows, phiên bản nâng cấp của ứng dụng Copilot có thể xem những gì hiển thị trên màn hình máy tính để tìm kiếm, thay đổi cài đặt, sắp xếp tệp và nhiều tác vụ khác.
Microsoft cũng giới thiệu tính năng Pages – một không gian làm việc tích hợp lấy cảm hứng từ ChatGPT Canvas và Artifacts của Claude, cho phép tổ chức ghi chú và nghiên cứu vào một canvas mà Copilot có thể hỗ trợ sắp xếp và chuyển thành tài liệu. Đi kèm với đó là tính năng Deep Research, giúp tìm kiếm, phân tích và kết hợp thông tin từ nhiều nguồn trực tuyến để trả lời các câu hỏi phức tạp.
Cuối cùng, Copilot giờ đây có thể ghi nhớ nhiều thông tin cá nhân hơn về người dùng – từ sở thích ẩm thực đến bộ phim yêu thích, cung cấp giải pháp cá nhân hóa và gợi ý chủ động. Microsoft khẳng định người dùng vẫn giữ quyền kiểm soát thông qua bảng điều khiển và có thể lựa chọn loại thông tin nào Copilot ghi nhớ hoặc từ chối hoàn toàn.
Các bước đi của Microsoft diễn ra trong bối cảnh cuộc đua AI đang nóng lên, với ChatGPT của OpenAI và Gemini của Google liên tục cải tiến và triển khai tính năng mới trong những tháng gần đây.