
Gemini Live vẫn đang chạy trên nền tảng Flash 2.5, nhưng các dấu hiệu gần đây từ bản beta của ứng dụng Google chỉ ra rằng một bước tiến lớn đang được chuẩn bị. Việc phân tích APK đã hé lộ nhiều tính năng thử nghiệm trong hệ sinh thái Gemini 3, đặc biệt là chế độ ‘Live Thinking’ và các khả năng tương tác nâng cao.
Gemini Live: nhanh chóng, ổn định nhưng vẫn còn hạn chế
Hiện tại, Gemini Live vẫn vận hành trên mô hình Gemini 2.5 Flash, lựa chọn lý tưởng về tốc độ phản hồi và hiệu quả sử dụng tài nguyên. Flash vốn được thiết kế để tối ưu tốc độ và sự nhanh nhạy trong các cuộc hội thoại trực tiếp. Với Gemini Live, người dùng có thể giao tiếp bằng giọng nói trực tiếp, nhận phản hồi ngay lập tức và sử dụng AI như trợ lý cá nhân cơ bản trên hệ điều hành Android.

Tuy nhiên, chính triết lý ‘nhanh và gọn’ này lại cũng tạo ra những giới hạn rõ rệt. Các câu trả lời từ Gemini Live hiện tại thường ngắn gọn, ưu tiên phản hồi tức thời hơn là phân tích sâu sắc. Trong một số tình huống, người dùng có thể cần câu trả lời chi tiết hơn, nhiều ngữ cảnh hơn hoặc thể hiện rõ quá trình suy luận. Tuy Flash 2.5 chưa hoàn toàn đáp ứng được yêu cầu này, nhưng đây không phải là một điểm yếu lớn, mà chỉ ra rằng Gemini Live vẫn đóng vai trò ‘trợ lý phản xạ nhanh’, chưa phải là một đối tác tư duy thực thụ.
Vì vậy, việc Google đang âm thầm chuẩn bị những nâng cấp lớn cho Gemini Live là điều dễ hiểu. Khi Gemini 3 Pro được ra mắt vào tháng 11, Google lần đầu tiên giới thiệu khái niệm ‘Labs’ – các phòng thí nghiệm tính năng, cho phép người dùng thử nghiệm công nghệ mới trước khi chúng được phát hành rộng rãi. Và với phiên bản 17.2 của ứng dụng Google, rõ ràng Gemini Live đang trở thành trung tâm trong chiến lược này.
Labs và Chế độ Tư duy Trực tiếp: Khi Gemini Live bắt đầu ‘suy nghĩ’
Qua chuyên mục APK Insight – nơi các tệp APK được giải mã để tìm manh mối về các tính năng sắp ra mắt – đã xuất hiện nhiều chi tiết đáng chú ý. Một trong số đó là hai phòng thí nghiệm mới trực tiếp liên quan đến Gemini Live: Chế độ Tư duy Trực tiếp (Live Thinking Mode) và Tính năng Thử nghiệm Trực tiếp.
Chế độ Tư duy Trực tiếp được mô tả rõ ràng là phiên bản nâng cấp của Gemini Live, cho phép ‘suy nghĩ kỹ càng hơn’ và cung cấp các phản hồi chi tiết hơn. Điều này cho thấy Gemini Live sẽ không còn bị giới hạn bởi nền tảng Flash 2.5, mà có thể chuyển sang các mô hình cao cấp hơn trong Gemini 3, như mô hình Tư duy hoặc Chuyên nghiệp. Nếu điều này trở thành sự thật, trải nghiệm hội thoại với AI sẽ thay đổi mạnh mẽ: câu trả lời không chỉ nhanh mà còn sâu sắc, dễ hiểu hơn và phản ánh quá trình suy luận thay vì chỉ đưa ra kết luận.

Song song với đó, Tính năng Thử nghiệm Trực tiếp mở ra nhiều khả năng mới. Theo mã nguồn, đây là nơi hội tụ các công nghệ tiên tiến như bộ nhớ đa phương thức, khả năng khử nhiễu tốt hơn, phản hồi khi phát hiện vật thể, và kết quả cá nhân hóa theo các ứng dụng Google mà người dùng sử dụng. Đặc biệt, khả năng khử nhiễu cải thiện là một nâng cấp rất giá trị trong môi trường thực tế.
Gemini Live trong tương lai: từ trợ lý hội thoại đến tác nhân hành động
Không chỉ dừng lại ở đó, danh sách Labs còn hé lộ hai hướng phát triển rất đáng chú ý. Thứ nhất là Điều khiển giao diện người dùng, với mô tả ‘nhân viên điều khiển điện thoại để hoàn thành nhiệm vụ’. Điều này cho thấy Gemini Live – hoặc nói rộng hơn là Gemini trên Android – có thể tiến gần đến khái niệm AI Agent, nơi AI không chỉ trả lời câu hỏi mà còn thao tác trực tiếp trên thiết bị, hỗ trợ người dùng hoàn thành công việc.

Thứ hai là Nghiên cứu chuyên sâu, cho phép ‘giao phó các nhiệm vụ nghiên cứu phức tạp cho người khác’. Mặc dù mô tả này còn khá mơ hồ, nhưng nó mở ra khả năng Gemini có thể xử lý những tác vụ dài hơi, nhiều bước, thay vì chỉ trả lời từng câu hỏi riêng biệt. Đây cũng chính là điều mà nhiều người đã kỳ vọng từ Gemini Agent, vốn được cho là sẽ xuất hiện trên Android như một phần của gói Computer Use.
Nếu Flash 2.5 đại diện cho giai đoạn ‘AI phản hồi nhanh’, thì Gemini Live trên nền tảng Gemini 3 hứa hẹn sẽ đưa AI vào giai đoạn ‘biết suy nghĩ, ghi nhớ và hành động’. Nếu các nâng cấp này thực sự được triển khai, trải nghiệm sử dụng Gemini Live trên Android sẽ không còn là trò chuyện với chatbot, mà là làm việc với một trợ lý thông minh, linh hoạt và ngày càng hiểu người dùng hơn.
Tạm kết
Trên đây là bài viết thông tin về ‘Gemini Live chuẩn bị nâng cấp lớn với ‘Chế độ tư duy’ và ‘Các tính năng thử nghiệm’. Hãy theo dõi trang tin tức Mytour để cập nhật những thông tin công nghệ mới nhất nhé. Và đừng quên truy cập kênh Mytour để không bỏ lỡ những tin tức công nghệ nóng hổi.
Nguồn: 9to5Google
