Mô hình AI tạo hình ảnh mới nhất của Midjourney đưa ra nhiều đột phá về kiến trúc và khả năng cá nhân hóa, giữa bối cảnh cạnh tranh gay gắt với OpenAI.
Midjourney – một trong những dịch vụ tiên phong trong lĩnh vực tạo hình ảnh bằng AI – vừa chính thức ra mắt V7, mô hình AI đầu tiên của họ sau gần một năm. Sự kiện diễn ra đúng một tuần sau khi đối thủ cạnh tranh OpenAI tung ra công cụ tạo hình ảnh mới trên ChatGPT, vốn đã nhanh chóng viral nhờ khả năng tạo ra hình ảnh phong cách Ghibli.
Kiến trúc hoàn toàn mới với cá nhân hóa theo mặc định
Theo David Holz, CEO của Midjourney, V7 sở hữu “kiến trúc hoàn toàn khác biệt” so với các phiên bản trước đó. Điểm nổi bật của mô hình mới này là khả năng xử lý văn bản (text prompt) thông minh hơn, chất lượng hình ảnh cao hơn với các chi tiết về kết cấu đẹp mắt, đồng thời cải thiện đáng kể độ chính xác trong việc tạo ra các chi tiết như cơ thể, bàn tay và các đối tượng phức tạp.
Đặc biệt, V7 là mô hình đầu tiên của Midjourney có tính năng cá nhân hóa được bật theo mặc định. Để sử dụng, người dùng cần đánh giá khoảng 200 hình ảnh để xây dựng hồ sơ “cá nhân hóa” Midjourney. Hồ sơ này sẽ điều chỉnh mô hình theo sở thích hình ảnh cá nhân của từng người dùng, một bước tiến quan trọng trong việc tạo ra trải nghiệm AI được cá nhân hóa cao.
V7 được cung cấp trong hai phiên bản: Turbo (tốn kém hơn để vận hành) và Relax. Đáng chú ý, mô hình này cũng cung cấp một công cụ mới gọi là Draft Mode, cho phép render hình ảnh nhanh hơn 10 lần và chi phí chỉ bằng một nửa so với chế độ tiêu chuẩn. Mặc dù hình ảnh Draft có chất lượng thấp hơn, nhưng chúng có thể được nâng cấp và render lại chỉ với một cú nhấp chuột.
Tuy nhiên, CEO Holz cũng lưu ý rằng một số tính năng tiêu chuẩn của Midjourney chưa có sẵn cho V7, bao gồm upscaling và retexturing. Theo dự kiến, những tính năng này sẽ được bổ sung trong tương lai gần, có thể trong vòng hai tháng tới.
Midjourney đang đi một con đường khá độc đáo trong thế giới AI. Thành lập vào năm 2022 bởi Holz, người đồng sáng lập công ty ngoại vi PC Leap Motion, công ty này hoạt động mà không hề huy động bất kỳ khoản đầu tư bên ngoài nào. Vào cuối năm 2023, Midjourney được báo cáo dự kiến đạt khoảng 200 triệu USD doanh thu.
Gần đây, công ty có trụ sở tại San Francisco này cho biết họ đang thành lập một nhóm phát triển phần cứng để làm việc trên một số dự án chưa được tiết lộ chi tiết. Đồng thời, họ tiếp tục huấn luyện các mô hình đã được công bố trước đó cho việc tạo video và đối tượng 3D.
TÍN DỤNG HÌNH ẢNH: MIDJOURNEY
Tuy nhiên, Midjourney cũng đang đối mặt với nhiều vụ kiện cáo buộc họ vi phạm quyền của hàng triệu nghệ sĩ bằng cách huấn luyện các công cụ AI trên hình ảnh thu thập từ web mà không có sự đồng ý của người tạo ra hình ảnh – một vấn đề pháp lý và đạo đức ngày càng nóng trong lĩnh vực AI sáng tạo.