OpenAI thông báo về Dall-E 3, phiên bản mới nhất của mô hình tổng hợp hình ảnh AI với nhiều cải tiến mới khi kết hợp với ChatGPT.
OpenAI công bố bản nâng cấp của công cụ chuyển đổi văn bản sang hình ảnh, Dall-E 3. Theo OpenAI, phiên bản mới này có khả năng hiểu bối cảnh tốt hơn, không bỏ qua từ cụ thể và xử lý 'nhiều sắc thái và chi tiết hơn' so với phiên bản trước đó.
Công cụ mới của OpenAI, Dall-E 3, kết hợp với ChatGPT để hỗ trợ việc tạo lời nhắc. Người dùng các gói ChatGPT cao cấp của OpenAI, bao gồm ChatGPT Plus và ChatGPT Enterprise, có thể yêu cầu hình ảnh và cải thiện nó thông qua cuộc trò chuyện với chatbot và nhận kết quả trực tiếp trong ứng dụng trò chuyện.
ChatGPT sẽ đưa ra prompt chỉ vài từ ngắn và mô tả hơn, cung cấp hướng dẫn thêm cho Dall-E 3.
Bên cạnh tích hợp ChatGPT, Dall-E 3 cũng hứa hẹn tạo ra bàn tay con người chính xác hơn, một nhiệm vụ mà nhiều trình tạo hình ảnh AI không thể làm được. Đối thủ Midjourney cũng có thông báo tương tự vào tháng trước, với tính năng mới cho phép chỉnh sửa một phần hình ảnh (xoá một ngón tay).
Ngoài việc công bố tính năng của Dall-E 3, OpenAI cũng bày tỏ mối lo ngại về tính lừa đảo của hình ảnh do AI tạo ra. OpenAI cho biết: “Chúng tôi cũng đang nghiên cứu cách giúp mọi người xác định hình ảnh được tạo ra bằng AI”.
Công ty đang tìm hiểu về một công cụ nội bộ có khả năng phân tích các tác phẩm được tạo ra bởi trí tuệ nhân tạo khác biệt so với nghệ thuật của con người. Hiện tại, OpenAI đang cố gắng cải thiện công cụ phát hiện văn bản do trí tuệ nhân tạo tạo ra, công cụ này đã có hiệu suất kém từ tháng 7.
Trong email của OpenAI, Dall-E 3 đã được huấn luyện để từ chối các yêu cầu tạo ra hình ảnh theo phong cách của các nghệ sĩ còn sống hoặc chân dung các nhân vật nổi tiếng. Ngoài ra, các nghệ sĩ cũng có thể từ chối sử dụng một số hoặc tất cả tác phẩm của họ để huấn luyện các mô hình tương lai của OpenAI chuyển văn bản thành hình ảnh.
Theo OpenAI, một trong những tính năng mới của Dall-E 3 sẽ được triển khai cho người dùng ChatGPT Plus vào tháng 10.