Từ ngày 10/10, người dùng Gemini (AI tạo sinh của Google) có thể tạo hình ảnh miễn phí thông qua các câu lệnh mà không cần phải chi tiền như với GPT-4 hay Midjourney.
Trình tạo hình ảnh AI Imagen 3 của Google hiện đã được cung cấp miễn phí cho tất cả người dùng Gemini trên cả thiết bị di động và máy tính để bàn. Imagen 3 tạo ra hình ảnh sinh động và chân thực, nhưng vẫn có một số hạn chế cho người dùng miễn phí.
Google gọi Imagen 3 là mô hình tạo ảnh chất lượng cao nhất từ trước đến nay, khẳng định rằng nó tuân theo hướng dẫn của bạn tốt hơn và giảm thiểu các dấu vết giả trong ảnh so với các mô hình trước. Tuy nhiên, để tạo hình ảnh của con người, bạn cần đăng ký Gemini Advanced với mức phí 19,99 USD (khoảng 500.000 đồng) mỗi tháng.
Khác với một số trình tạo hình ảnh AI khác, Imagen chỉ tạo ra một hình ảnh cho mỗi câu lệnh. Bạn có thể yêu cầu thay đổi để tinh chỉnh hình ảnh, vì nó ghi nhớ những yêu cầu trước đó, nhưng một hình ảnh mới sẽ được tạo cho mỗi câu lệnh bạn nhập.
Tranh được tạo ra bởi Gemini.
Nếu bạn thích bản xem trước, bạn có thể tải xuống hình ảnh với định dạng JPEG có độ phân giải 2048 x 2048. Bạn có thể tải xuống bao nhiêu hình ảnh tùy thích, vì không có giới hạn cụ thể hàng ngày cho việc tạo hình ảnh, ngay cả ở cấp miễn phí.
Google cho biết Imagen 3 có khả năng tạo hình ảnh theo nhiều phong cách khác nhau, từ chân thực đến tranh vẽ sơn dầu, tranh phong cảnh, động vật, tĩnh vật, thậm chí là truyện tranh. Kết quả nhìn chung đạt yêu cầu ở mức minh họa.
Tác giả đã thử nghiệm một số tính năng của trình tạo ảnh này và nhận thấy ngoài việc không thể tạo hình người, còn một số vấn đề khác như sau:
Đầu tiên, Gemini tỏ ra khá "cứng đầu"; mặc dù bạn có thể tùy chỉnh hình ảnh ban đầu nhiều lần, nhưng mức độ tùy chỉnh lại rất hạn chế. Ví dụ, khi yêu cầu Gemini tạo ra hình ảnh một chú chó buồn bên hồ, hình ảnh đầu tiên đã tương đối tốt về chất lượng.
Tuy nhiên, khi muốn thay đổi góc chụp (thực ra là góc vẽ) và màu sắc, như làm cho hình ảnh rộng hơn, có toàn bộ chú chó và phông nền phía sau vẫn rõ nét, màu sắc ấm áp hơn, kết quả lại khá thất vọng. Dù đã yêu cầu rõ ràng, Gemini vẫn giữ nguyên góc ảnh, không thể thay đổi hay mở rộng ra.
Độ tùy biến cho hình ảnh tạo ra ban đầu còn thấp.
Ngay cả khi tạo một yêu cầu mới, lần này mô tả rõ ngay từ đầu (một chú chó buồn bên hồ, sử dụng ống kính góc rộng, với độ sâu trường ảnh rộng và chụp toàn bộ chú chó), thì kết quả vẫn như vậy, thậm chí vẫn là một chú chó labrador nhưng chỉ khác màu lông.
Nếu không tạo chó nữa thì sao? Thử yêu cầu Gemini tạo hình ảnh một chú mèo từ xa, trên cây. Kết quả đầu tiên giống như tranh vẽ. Sau khi điều chỉnh, hình ảnh có vẻ thật hơn, nhưng dễ nhận ra khuôn mặt chú mèo rất giả, không còn tự nhiên như góc cận. Sau một lần thử nữa, đến lượt thân cây và lá cũng có chi tiết giả mạo.
Đã đến lúc thử tạo ảnh phong cảnh. Khi yêu cầu Gemini tạo hình ảnh bắc cực quang với mức độ chân thực cao nhất có thể, và một bức ảnh hồ mùa thu tuyệt đẹp ở Canada, thì vẫn dễ dàng nhận ra đây là hình ảnh AI do chi tiết quá mịn màng và màu sắc quá rực rỡ.
Ngoài những hình ảnh chân thực, Gemini còn có khả năng tạo ra các hình ảnh theo phong cách mỹ thuật khác như tranh sơn dầu phong cách Phục Hưng, hay thậm chí là tranh Ai Cập cổ đại và manga (Gemini không hỗ trợ tạo tranh không màu). Bạn có thể tự đánh giá kết quả.
Tổng kết lại, trình tạo ảnh Gemini của Google không có gì nổi bật hơn so với các AI khác, ngoại trừ việc nó miễn phí không giới hạn và linh hoạt với nhiều phong cách khác nhau. Bạn đã thử nghiệm với AI này chưa? Hãy chia sẻ cảm nhận của bạn ở phần bình luận bên dưới.