OpenAI tăng cường khả năng tạo ảnh

OpenAI tạo sinh tiếp tục bứt phá với tính năng chỉnh sửa và tạo hình ảnh chi tiết hơn, ban đầu chỉ dành cho người dùng Pro.

OpenAI vừa thực hiện bước nâng cấp đáng kể đầu tiên cho khả năng tạo ảnh của ChatGPT trong hơn một năm qua, theo thông báo từ CEO Sam Altman trong buổi livestream hôm thứ Ba. Động thái này tiếp tục khẳng định vị thế dẫn đầu của công ty trong cuộc đua phát triển các mô hình trí tuệ nhân tạo tạo sinh.

Cụ thể, ChatGPT hiện có thể tận dụng mô hình GPT-4o để tạo và chỉnh sửa hình ảnh một cách tự nhiên – một tính năng trước đây không có trong phiên bản mô hình này. Mặc dù GPT-4o đã được tích hợp vào nền tảng chatbot từ trước, nhưng cho đến nay, khả năng của nó chỉ giới hạn trong việc tạo và chỉnh sửa văn bản.

BÀI VIẾT LIÊN QUAN

Amazon giành được lệnh tòa án chặn tác nhân mua sắm AI của Perplexity

AI agent của Alibaba tự đào tài sản mã hóa và thiết lập đường hầm bí mật trong quá trình huấn luyện

Alchemy trao quyền tự chủ tài chính cho AI agent trên hơn 100 blockchain

Nghiên cứu cho thấy các mô hình AI ưu tiên Bitcoin hơn tiền pháp định và stablecoin

Phân phối theo từng gói dịch vụ và ứng dụng công nghệ

Theo OpenAI, tính năng tạo ảnh mới đã được triển khai cho người đăng ký gói Pro có giá 200 USD/tháng, không chỉ trong ChatGPT mà còn cả Sora – sản phẩm tạo video AI của công ty. Công ty cũng cho biết sẽ sớm mở rộng tính năng này cho người dùng gói Plus và miễn phí, cũng như các nhà phát triển sử dụng API của họ.

Điểm nổi bật của GPT-4o với đầu ra hình ảnh là khả năng “suy nghĩ” lâu hơn so với DALL-E 3 – mô hình mà nó thay thế – để tạo ra những hình ảnh được mô tả là chính xác và chi tiết hơn. Không chỉ tạo mới, GPT-4o còn có thể chỉnh sửa hình ảnh hiện có, bao gồm cả những hình có con người, thông qua việc biến đổi hoặc “inpainting” các chi tiết như đối tượng ở tiền cảnh và hậu cảnh.

Về nguồn dữ liệu huấn luyện, OpenAI tiết lộ với Wall Street Journal rằng họ đã đào tạo GPT-4o trên “dữ liệu có sẵn công khai” kết hợp với dữ liệu độc quyền từ các đối tác như Shutterstock. Đây là một thông tin đáng chú ý, bởi nhiều nhà cung cấp AI tạo sinh thường giữ kín chi tiết về dữ liệu huấn luyện do lo ngại về các vụ kiện liên quan đến quyền sở hữu trí tuệ.

“Chúng tôi tôn trọng quyền của nghệ sĩ về cách chúng tôi thực hiện đầu ra và chúng tôi có các chính sách để ngăn chúng tôi tạo ra những hình ảnh mô phỏng trực tiếp tác phẩm của bất kỳ nghệ sĩ sống nào,” Brad Lightcap, giám đốc điều hành của OpenAI, cho biết trong tuyên bố với Journal.

Để thể hiện cam kết này, OpenAI cung cấp biểu mẫu từ chối cho người sáng tạo muốn yêu cầu loại bỏ tác phẩm của họ khỏi tập dữ liệu huấn luyện. Công ty cũng tôn trọng các yêu cầu chặn bot web scraping thu thập dữ liệu từ các trang web.

Bước tiến này của OpenAI diễn ra trong bối cảnh Google cũng vừa thử nghiệm tính năng tạo hình ảnh cho Gemini 2.0 Flash – một trong những mô hình hàng đầu của họ. Tuy nhiên, phiên bản của Google đã gặp phải tranh cãi khi thiếu các biện pháp bảo vệ đầy đủ, cho phép người dùng xóa hình mờ và tạo hình ảnh mô tả các nhân vật có bản quyền.