Dù vẫn tồn tại một số lỗi cũ, khả năng tạo ảnh của giờ đây đã vượt trội hơn rất nhiều so với trước kia.
Chatbot đã có bước tiến dài trong những năm qua: từ việc chỉ tạo văn bản, giờ đây chúng đã có thể sinh ra hình ảnh.
Với bản cập nhật mới nhất, nay đã đạt bước đột phá trong việc tạo hình. OpenAI cho biết công nghệ mới giúp chatbot tạo ra hình ảnh phức tạp, chi tiết và có khả năng hiểu các yêu cầu độc đáo từ người dùng.
Ví dụ, khi được yêu cầu tạo truyện tranh gồm 4 khung với nhân vật tương tác trong từng hình, có thể xử lý toàn bộ cùng lúc thay vì từng bước riêng lẻ như trước. Những phiên bản trước cũng tạo được hình, nhưng độ chính xác còn thấp và chưa kết hợp tốt các yếu tố để tạo ra kết quả mạch lạc.
Nhờ ứng dụng nền tảng GPT-, giờ có thể tiếp nhận và phản hồi các lệnh qua giọng nói, hình ảnh và video. Thậm chí, nó còn có thể phát âm thành câu hoàn chỉnh.

Một trang truyện tranh do tạo ra - Ảnh: NYT.
Sự ra đời của phiên bản mới, cùng với loạt cập nhật từ Google cho Gemini hay nâng cấp Grok của xAI, cho thấy ngành trí tuệ nhân tạo đang đứng trước những biến chuyển lớn. Từ chỗ chỉ là công cụ tạo văn bản, chatbot giờ đang tiến hóa thành nền tảng đa năng kết hợp trò chuyện với nhiều khả năng khác.
“Đây là một dạng công nghệ hoàn toàn mới”, nhà nghiên cứu Gabriel Goh tại OpenAI chia sẻ. “Chúng tôi không phân tách việc tạo văn bản và hình ảnh. Mục tiêu là xử lý tất cả các tác vụ cùng lúc”.
Trước kia, các công cụ tạo ảnh bằng AI thường gặp khó khi phải tạo ra hình ảnh khác biệt rõ rệt với các mẫu đã biết. Ví dụ, yêu cầu tạo một chiếc xe đạp có bánh hình tam giác thường khiến chúng lúng túng.
Theo ông Goh, phiên bản mới của đã có khả năng xử lý những đề bài kỳ lạ như vậy.

Ý tưởng về chiếc xe đạp có bánh tam giác từng làm khó cũ - Ảnh: OpenAI.
Phiên bản mới sẽ được triển khai trên cả hai gói miễn phí và trả phí, gồm Plus (20 USD/tháng) và Pro (200 USD/tháng).
Tuy nhiên, phiên bản mới của vẫn còn một số hạn chế. Tình trạng "bịa" thông tin vẫn tồn tại, khả năng sinh văn bản ngoài bảng ký tự Latin còn yếu. Ngoài ra, công cụ vẫn gặp khó khi phải xử lý đồng thời 10-20 khái niệm – như minh họa với bảng tuần hoàn các nguyên tố hóa học dưới đây.

Bảng tuần hoàn các nguyên tố vẫn chưa được tái hiện chính xác hoàn toàn - Ảnh: OpenAI.
Trong thời gian tới, OpenAI sẽ tiếp tục nỗ lực để khắc phục những hạn chế này.
