Dựa trên chip Ironwood, Google đang từng bước xây dựng nền tảng cho một thế hệ AI thông minh, tiết kiệm năng lượng và có khả năng phản hồi vượt trội, thách thức các đối thủ trong cuộc đua AI toàn cầu.
AI đang là lĩnh vực công nghệ nóng nhất hiện nay, và các ông lớn công nghệ liên tục cho ra mắt những sản phẩm đột phá để dẫn đầu kỷ nguyên trí tuệ nhân tạo. Tại sự kiện Google Cloud Next ’25, Google đã chính thức giới thiệu Ironwood – thế hệ chip TPU thứ 7 của hãng, được thiết kế đặc biệt cho các mô hình AI.
Khác biệt với các thế hệ trước chủ yếu tập trung vào huấn luyện AI, Ironwood được tối ưu cho giai đoạn suy luận (inferencing), nơi AI không chỉ học mà còn phải phân tích và đưa ra quyết định thông minh. Đây cũng là bước đệm cho "kỷ nguyên suy luận" mà Google đang hướng tới, trong đó AI sẽ chủ động xử lý thông tin và đưa ra những câu trả lời chính xác hơn thay vì chỉ đơn thuần cung cấp dữ liệu.

Ironwood không chỉ có triết lý mới mà còn sở hữu thông số kỹ thuật cực kỳ ấn tượng: khi được triển khai với 9.216 chip trong mỗi cụm, nó đạt hiệu suất lên tới 42,5 exaflops, gấp 24 lần so với El Capitan – siêu máy tính nhanh nhất hiện nay (1,7 exaflops).
Bên cạnh khả năng tính toán mạnh mẽ, Ironwood còn trang bị 192 GB bộ nhớ HBM, gấp 6 lần so với thế hệ trước là Trillium. Băng thông bộ nhớ mỗi chip đạt 7,2 terabit/giây, tăng gấp 4,5 lần so với các phiên bản trước. Điều này không chỉ nâng cao hiệu suất mà còn giúp tiết kiệm năng lượng – yếu tố quan trọng trong cuộc đua AI toàn cầu.
Không chỉ cải tiến phần cứng, Google còn tiết lộ Ironwood sẽ là nền tảng cho các mô hình AI hàng đầu của hãng, bao gồm Gemini 2.5. Trong sự kiện, Google cũng giới thiệu Gemini 2.5 Flash – phiên bản nhẹ và giá rẻ hơn của Gemini, thiết kế để đáp ứng yêu cầu nhanh chóng và linh hoạt, tùy vào mức độ phức tạp của tác vụ.
Trong một buổi trình diễn trực tiếp, Google đã giới thiệu hệ sinh thái AI sáng tạo đa phương tiện của mình, từ text-to-image, text-to-video đến công cụ mới text-to-music mang tên Lyria. Các mô hình này kết hợp với nhau để tạo ra một video quảng cáo cho buổi hòa nhạc hoàn chỉnh – tất cả chỉ từ một mô tả văn bản.
Mặc dù Ironwood là tâm điểm, Google khẳng định đây chỉ là một phần trong chiến lược AI tổng thể của mình. Công ty cũng ra mắt Cloud WAN – mạng diện rộng được quản lý toàn diện, giúp doanh nghiệp kết nối trực tiếp với hạ tầng mạng của Google, nâng cao hiệu suất lên 40% và giảm chi phí vận hành 40%.
Anh Việt
