Toàn bộ GPU Instinct, Radeon và bộ vi xử lý Ryzen AI đều tương thích với Gemma 4 từ 2 tỷ đến 31 tỷ tham số, giúp người dùng cá nhân chạy qua LM Studio hoặc Lemonade Server mà không cần phần cứng chuyên dụng.
AMD đã công bố hỗ trợ Gemma 4 ngay từ ngày ra mắt (Day Zero) trên toàn bộ phần cứng AI của hãng, từ GPU trung tâm dữ liệu đến CPU máy tính cá nhân.
Gemma 4 là thế hệ mô hình AI mã nguồn mở mới nhất của Google, với các phiên bản từ 2 tỷ đến 31 tỷ tham số. AMD xác nhận tất cả GPU Instinct, Radeon và bộ xử lý Ryzen AI đều có thể chạy Gemma 4, bao gồm GPU cho máy chủ doanh nghiệp, GPU trạm AI và CPU Ryzen AI cho PC thế hệ mới.

Với doanh nghiệp và nhà phát triển, AMD cho phép triển khai Gemma 4 qua nhiều framework phổ biến. Trên vLLM, tất cả GPU AMD tương thích đều chạy được Gemma 4, từ Instinct đến Radeon. Framework SGLang cũng hỗ trợ GPU MI300X, MI325X và MI35X, chạy được cả mô hình dày đặc (E2B, E4B, 31B) và biến thể MoE (26B-A4B). Đáng chú ý, toàn bộ Gemma 4 vừa trên một GPU MI300X duy nhất với 192 GB HBM ở độ dài ngữ cảnh đầy đủ.
Người dùng phổ thông có hai cách để chạy AI trên PC: LM Studio, ứng dụng phổ biến cho phép tải và chạy các mô hình AI. Chỉ cần có bộ xử lý Ryzen AI, Ryzen AI Max, hoặc card Radeon/Radeon PRO, tải LM Studio và cài driver AMD Software: Adrenalin Edition mới nhất là có thể sử dụng Gemma 4.

Phương án thứ hai là Lemonade Server, phần mềm máy chủ AI mã nguồn mở với API tương thích OpenAI. Lemonade tăng tốc qua ROCm trên GPU Radeon/Radeon PRO và hỗ trợ NPU XDNA 2 trên Ryzen AI, cho phép Gemma 4 chạy trên cả GPU lẫn chip AI tích hợp CPU, tiết kiệm điện năng trong nhiều tình huống sử dụng.
Hỗ trợ NPU cho các phiên bản Gemma-4 E2B và E4B sẽ xuất hiện trong bản cập nhật Ryzen AI SW tiếp theo, sau đó được tích hợp vào Lemonade và đồng thời cung cấp trực tiếp cho nhà phát triển thông qua OnnxRuntime API.
