Dù không tập trung vào bổ sung tính năng, các phiên bản AI mới từ Google giúp dev giảm thiểu đáng kể ngân sách vận hành hệ thống.
Google chính thức công bố đợt cập nhật quy mô nhất năm cho dòng AI Gemini, mang đến bước nhảy vọt về cả tốc độ xử lý và tiết kiệm ngân sách, nhằm cạnh tranh trực tiếp với OpenAI và các đối thủ hàng đầu.
Sau quá trình dài nghiên cứu và hoàn thiện, phiên bản cao cấp Gemini 2.5 Pro chính thức ra mắt thị trường, sẵn sàng hỗ trợ các dự án quy mô lớn. Đây được xem là nước cờ chiến lược giúp Google thu hẹp khoảng cách với đối thủ OpenAI đang thống lĩnh thị trường AI bằng dòng sản phẩm GPT.

Nổi bật trong đợt cập nhật này là sự xuất hiện của Gemini 2.5 Flash-Lite - phiên bản siêu tiết kiệm dành riêng cho các dev có ngân sách hạn chế nhưng cần xử lý khối lượng công việc khổng lồ. So với bản Flash thông thường, Flash-Lite chỉ tiêu tốn 1/3 chi phí xử lý dữ liệu đầu vào (văn bản, hình ảnh, video) và giảm đến 6 lần chi phí cho dữ liệu đầu ra.
Dù hiệu năng xử lý không bằng các phiên bản cao cấp, Google tự tin Flash-Lite sẽ là giải pháp tối ưu cho các ứng dụng xử lý big data không yêu cầu độ phức tạp cao. Chiến lược này cho thấy Google đang mở rộng đối tượng khách hàng từ các tập đoàn công nghệ đến cộng đồng startup và developer cá nhân.
Điểm đột phá đáng chú ý là tính năng 'kiểm soát ngân sách AI' được tích hợp trên toàn bộ dòng Gemini 2.5. Công cụ này cho phép dev điều chỉnh linh hoạt mức độ xử lý của AI, cân đối giữa chất lượng và chi phí phù hợp với yêu cầu cụ thể của từng dự án.
Google đã khéo léo tích hợp các phiên bản AI mới vào hệ thống tìm kiếm, tự động phân loại và chọn lựa mô hình phù hợp cho từng dạng truy vấn. Những yêu cầu phức tạp sẽ do Gemini 2.5 Pro đảm nhận, trong khi các tìm kiếm đơn giản có thể sử dụng Flash hoặc Flash-Lite để tiết kiệm tài nguyên hệ thống.

Toàn bộ phiên bản nâng cấp của Gemini AI đều tập trung vào mục tiêu giúp các developer giảm thiểu tối đa chi phí vận hành
Bản phát hành chính thức Gemini 2.5 Pro phiên bản 06-05 đã được lựa chọn sau khi khắc phục hoàn toàn các lỗi từ bản trước. Điều này thể hiện triết lý phát triển của Google khi luôn ưu tiên sự ổn định trước khi đưa sản phẩm đến tay người dùng đại trà.
Với người dùng phổ thông, những thay đổi này gần như không đem lại khác biệt rõ rệt trong trải nghiệm hàng ngày với Gemini, vì các bản cập nhật đã được triển khai từ trước. Nhưng đối với giới phát triển, đây là bước tiến quan trọng khi họ được tiếp cận những công cụ AI mạnh mẽ với mức giá linh hoạt hơn bao giờ hết.
Cơ chế phân quyền truy cập vẫn được áp dụng: người dùng miễn phí bị giới hạn tính năng, tài khoản Pro được 100 lượt truy vấn/ngày, trong khi gói AI Ultra được quyền sử dụng không giới hạn Gemini 2.5 Pro.
Google thực hiện động thái này trong bối cảnh đang nỗ lực lấy lại vị thế trên thị trường AI sau thành công vang dội của . Bằng cách đa dạng hóa các gói dịch vụ với mức giá và hiệu năng khác nhau, Google kỳ vọng sẽ thu hút nhiều nhà phát triển chuyển sang nền tảng Gemini thay vì các đối thủ cạnh tranh.
Sự xuất hiện của Flash-Lite trở nên đặc biệt ý nghĩa khi thị trường AI ngày càng coi trọng yếu tố chi phí và khả năng mở rộng. Trong bối cảnh các doanh nghiệp muốn triển khai AI quy mô lớn, vấn đề ngân sách vận hành trở thành yếu tố then chốt không kém hiệu suất xử lý.
Tác giả: Nguyễn Hải (Nguồn: Arstechnica)
