Google đã giới thiệu phiên bản cải tiến của Gemini. Vậy hiệu năng của nó như thế nào?
Sau một thời gian thử nghiệm với nhóm người dùng có độ tin cậy cao, công cụ Gemini 2.0 Flash đã chính thức có mặt tại các quốc gia hỗ trợ Google AI Studio, bao gồm cả Việt Nam. Bạn có thể trải nghiệm các tính năng mới của Gemini 2.0 Flash qua trang chủ Google AI Studio hoặc thông qua API chính thức của Gemini.
Gemini 2.0 Flash có khả năng xử lý nhiều loại đầu vào khác nhau như văn bản, hình ảnh, âm thanh, cùng với khả năng suy luận và hiểu ngôn ngữ tự nhiên vượt trội. Nó kết hợp các yếu tố này để tạo ra hình ảnh ấn tượng.
Việc thử nghiệm các tính năng của Gemini 2.0 Flash đã mang lại những kết quả đáng chú ý.
Một trong những thử nghiệm nổi bật là khả năng thay đổi phông nền của hình ảnh. Gemini có thể tách chủ thể ra khỏi ảnh và thay phông nền thành công. Đặc biệt, khả năng hiểu ngôn ngữ tự nhiên của Gemini 2.0 Flash đã cho thấy sự chính xác khi mô hình AI hiểu rõ yêu cầu đầu vào.

Gemini 2.0 Flash có thể thay phông nền cho ảnh một cách nhanh chóng và gọn gàng. Mặc dù chưa hoàn toàn thuyết phục, người dùng vẫn có thể điều chỉnh prompt để có kết quả chân thực hơn - Ảnh chụp màn hình.

Toàn bộ phông nền được tạo ra hoàn toàn bởi AI.

Người dùng có thể tiếp tục chỉnh sửa hình ảnh thông qua việc điều chỉnh prompt - Ảnh chụp màn hình.
Trước đây, các hệ thống AI gặp phải không ít vấn đề trong việc sinh chữ. Tuy nhiên, khi các mô hình AI trở nên tiên tiến hơn, chúng sẽ khắc phục những hạn chế này. Dù vậy, Gemini 2.0 Flash hiện vẫn đang gặp phải vấn đề tương tự. Ví dụ dưới đây sẽ làm rõ điều này:

Mô hình AI của Google gặp lỗi khi sinh chữ trên ảnh - Ảnh: Facebook nhân vật.
Trong một trường hợp khác, Gemini 2.0 Flash của Google thể hiện khả năng hiểu bối cảnh và sinh chữ một cách tinh tế.

Gemini 2.0 Flash nhanh chóng nhận diện nội dung của ảnh, thậm chí hiểu rõ bối cảnh của "một cụm từ phổ biến" - Ảnh chụp màn hình.

Kết quả ấn tượng khi prompt yêu cầu giữ nguyên phông chữ nhưng thay đổi nội dung - Ảnh chụp màn hình.
Nhìn vào những trường hợp này, người dùng có thể rút ra kết luận rằng mô hình AI của Google vẫn chưa hoàn thiện, nhưng đã chứng minh được tiềm năng to lớn. Khi người dùng tiếp tục trải nghiệm và Google tiếp tục phát triển Gemini, chúng ta sẽ chứng kiến những bước tiến ấn tượng hơn nữa.
Gemini 2.0 Flash, giống như bất kỳ mô hình nào khác, sẽ chỉ thật sự hiệu quả khi thời gian trả lời câu hỏi này một cách thực tế.
Bạn có thể trải nghiệm Gemini 2.0 Flash qua đường link này.
