AI tạo video Sora của OpenAI tạo ra MV đầu tiên, và nó 'kỳ ảo' đúng như mọi người tưởng tượng
Giải thích và tổng hợp một số prompt hay có thể áp dụng được cho ChatGPT
Đừng nghĩ hệ thống trí tuệ nhân tạo không biết gì, chúng có thể là lỗ hổng bảo mật đấy
Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?Tìm hiểu về Google Imagen AI, mô hình trí tuệ nhân tạo của Google chuyển đổi văn bản thành hình ảnh.
Cuối năm 2021 đánh dấu sự thay đổi lớn của thế giới công nghệ với sự phát triển vũ bão của các công cụ trí tuệ nhân tạo như ChatGPT, Bing hay Google Bard. Trước đó, chúng ta đã biết đến DALL-E và Midjourney với khả năng tạo ra hình ảnh dựa trên văn bản được người dùng nhập vào, sự ra đời của chúng đã làm điên đảo cộng đồng thiết kế. Google cũng tham gia vào 'cuộc chơi' này.
Imagen AI là một mô hình chuyển đổi văn bản thành hình ảnh được Google phát triển. Imagen AI tiếp tục mở rộng danh sách các công cụ tạo hình ảnh từ văn bản bằng trí tuệ nhân tạo, với các tên gọi như DALL-E 2, Dream by Wombo và Midjourney. Tất cả đều có khả năng tạo ra những hình ảnh tuyệt vời từ mô tả văn bản.
Tính đến hiện tại, Google đã cập nhật Imagen AI lên phiên bản 2.0 (Imagen 2) với nhiều cải tiến. Ngay cả khi bạn không phải là nhà phát triển hoặc doanh nghiệp, Imagen 2 là lựa chọn đáng để thử nghiệm - miễn phí thông qua việc sử dụng Google Cloud.
Imagen 2 đã có bước tiến lớn so với phiên bản trước đó và cung cấp một trình tạo hình ảnh AI hoàn chỉnh, có khả năng tạo ra các kết quả nghệ thuật và thực tế. Nó được tích hợp trong bộ công cụ Vertex AI của Google và có thể truy cập thông qua tài khoản Google Cloud.
So với phiên bản đầu tiên của Imagen, được ra mắt vào tháng 5 năm 2022, phiên bản beta chỉ có sẵn thông qua ứng dụng AI Test Kitchen với giới hạn. Người dùng chỉ có thể thử tạo ra cảnh quan thành phố hoặc các nhân vật giống như trong phim hoạt hình Pixar.
Imagen 2 có các tính năng như Inpainting và Outpainting, cho phép bạn thêm hoặc mở rộng nội dung trong hình ảnh. Điều đặc biệt là bạn có thể sử dụng hình ảnh tham chiếu khi tạo hình ảnh, điều mà DALL-E 2 cũng hỗ trợ.
Nếu bạn đang muốn tìm một công cụ biến văn bản thành hình ảnh thông qua trí tuệ nhân tạo, hãy khám phá Imagen 2. Mặc dù kết quả vẫn chưa hoàn hảo, nhưng đây là điểm mà Google đặc biệt quan tâm khi phát triển công cụ này.
Đường dẫn và trải nghiệm Google's Imagen 2
Imagen 2 hướng tới nhà phát triển và doanh nghiệp, nhưng dành cho cá nhân, bạn cũng có thể thử nghiệm bằng cách đăng ký tài khoản Google Cloud miễn phí như sau:
Bước 1: Truy cập trang web Google Cloud tại địa chỉ 'cloud.google.com' và nhấn Start free.
Bước 2: Nhập thông tin cơ bản về tài khoản Google của bạn theo yêu cầu.
Bạn cần thêm thẻ tín dụng để thanh toán nhưng không cần lo lắng về các khoản phí trong tương lai. Google cam kết rằng bạn sẽ không bị tự động tính phí sau khi kết thúc thời gian dùng thử miễn phí.
Bước 3: Sau khi tạo xong tài khoản Google Cloud miễn phí, nhấn vào menu mở rộng trên trang chủ Google Cloud và chọn Vertex AI Vision.
Bước 4: Khi trang Vertex AI Vision mở ra, tiếp tục nhấn vào 'Studio'.
Bước 5: Tiếp tục chọn Enable ở Vision AI API.
Bước 6: Thực hiện việc tạo một ứng dụng trống mới.
Bước 7: Sau khi đã hoàn tất, nhấn vào Vision Powered by Image.
Bước 8: Sử dụng Imagen 2 yêu cầu sự phê duyệt từ Google, quá trình này có thể mất vài ngày.
Kết
Đằng sau hậu trường, Imagen được đào tạo bằng việc sử dụng bộ dữ liệu công khai có tên LAION-400M, kết hợp với dữ liệu nội bộ. Không phải tất cả các công ty AI đều công khai thông tin này; một ví dụ là DALL-E 2.
Việc sử dụng các bộ dữ liệu đã trở thành một vấn đề gây tranh cãi, một phần do việc thu thập hàng triệu hình ảnh từ Internet. Đặc biệt, các nghệ sĩ đã chỉ trích các công ty AI vì không có sự đồng ý từ chủ sở hữu hình ảnh hoặc tác phẩm nghệ thuật trước khi sử dụng nó để đào tạo các mô hình AI.
Nếu bạn lo ngại về việc hình ảnh của mình có được sử dụng để đào tạo mô hình AI hay không, bạn có thể kiểm tra và chọn không tham gia.