Gboard, ứng dụng bàn phím nổi tiếng của Google trên Android, sẽ được nâng cấp với khả năng tạo hình ảnh từ văn bản, sử dụng trí tuệ nhân tạo và các mô hình ngôn ngữ như DALL-E 2.Tuy nhiên, Google không chọn DALL-E 2 mà thay vào đó, họ sử dụng mô hình tự tạo ra, mang tên là Imagen. Mô hình này được mô tả là sự kết hợp độc đáo giữa hiểu biết sâu sắc về ngôn ngữ và hiểu biết hiện thực chưa từng có. Kết quả khảo sát về các công cụ như DALL-E 2, Imagen, Latent Diffusion được đánh giá cao với khả năng tái tạo hình ảnh từ văn bản của Imagen.
Phiên bản beta mới nhất của Gboard đang có tính năng chuyển văn bản thành hình ảnh, được 9to5Google phát hiện thông qua mã nguồn.Nếu tích hợp Imagen vào Gboard, người dùng có thể sáng tạo nhiều emoji và hình ảnh thú vị hơn trong các cuộc trò chuyện. Hiện tại, tính năng Emoji Kitchen của Google cho phép người dùng tùy chỉnh emoji để tạo sticker. Tuy nhiên, vì lo ngại về tác động xã hội của các model AI, Google chưa triển khai thử nghiệm rộng rãi với Imagen sau sự cố với Bard, khiến mất cả 100 tỷ đô vốn hoá của Alphabet - công ty mẹ của Google.Google tiếp tục đua trong lĩnh vực trí tuệ nhân tạo, tích hợp các model AI vào sản phẩm và dịch vụ. Tuy nhiên, để có cái nhìn rõ ràng nhất, người dùng cần chờ đến sự kiện Google I/O để nhận cái nhìn cụ thể nhất.
Theo thông tin từ trang 9to5Google.