Nhờ sự kết hợp giữa dòng EPYC 9005-series và Instinct MI300X, AMD không chỉ khẳng định vị thế dẫn đầu trong công nghệ mà còn thiết lập một chuẩn mực mới về hiệu suất năng lượng, góp phần xây dựng một tương lai công nghệ bền vững.
Hiệu suất năng lượng là yếu tố quyết định trong việc nâng cao hiệu năng của các bộ xử lý AI và HPC. Đây là lĩnh vực mà AMD và các đối thủ công nghệ không ngừng cải tiến qua từng thế hệ sản phẩm mới. Vào năm 2021, AMD đặt mục tiêu cải thiện hiệu suất năng lượng của bộ vi xử lý EPYC và bộ tăng tốc Instinct lên 30 lần vào năm 2025, nhưng đã đạt được thành tựu này sớm hơn, nhờ vào các sản phẩm EPYC 9005-series 'Turin' và Instinct MI300X.

Thành quả vượt ngoài mong đợi
AMD đã thử nghiệm hiệu suất xử lý với một hệ thống bao gồm hai CPU EPYC 9575F, mỗi CPU có 64 nhân, tám bộ tăng tốc Instinct MI300X và 2.304 GB RAM DDR5 trong mô hình Llama3.1-70B. Hệ thống mới này đạt hiệu suất năng lượng cao gấp 28,3 lần so với một hệ thống không được tiết lộ từ năm 2020.
Mặc dù AMD không tiết lộ chi tiết cấu hình của hệ thống cũ, có thể dự đoán rằng nó sử dụng các CPU EPYC 7002-series với kiến trúc Zen 2 và các bộ tăng tốc Instinct MI100 dựa trên kiến trúc CDNA 1.
Sự khác biệt về hiệu năng giữa hai thế hệ sản phẩm là rõ rệt. Chẳng hạn, MI300X hỗ trợ FP8 với hiệu suất tương đương INT8, trong khi MI100 không hỗ trợ định dạng này. MI300X đạt hiệu suất INT8 lên tới 2.615 TOPS (5.230 TOPS khi có sparsity), vượt xa MI100 với chỉ 184,6 TOPS. Bộ nhớ HBM3 192 GB với tốc độ 5,30 GB/s của MI300X cũng vượt trội so với bộ nhớ HBM2 32 GB tốc độ 1,20 GB/s của MI100.
AMD cho biết, ngoài các cải tiến mạnh mẽ về phần cứng, những bước tiến trong kiến trúc và tối ưu hóa phần mềm đã đóng vai trò quan trọng trong việc nâng cao hiệu suất năng lượng. Công ty mới đây đã giới thiệu bộ tăng tốc Instinct MI325X với kiến trúc CDNA 3 và bộ nhớ HBM3E dung lượng 288 GB. Vào năm 2025, AMD dự kiến ra mắt MI355X với kiến trúc CDNA 4, giúp cải thiện hiệu suất FP8 và FP16 lên khoảng 80% so với MI325X. MI355X cũng sẽ hỗ trợ định dạng FP4 và FP6, đạt hiệu suất lên tới 9,2 PetaFLOPS (FP4), rất hữu ích cho các mô hình ngôn ngữ quy mô lớn.
Sam Naffziger, Phó Chủ tịch cấp cao và Kiến trúc sư Công nghệ Sản phẩm tại AMD, đã chia sẻ:
"Với chiến lược kết hợp giữa phần cứng và phần mềm, chúng tôi rất tự tin vào kế hoạch vượt qua mục tiêu 30x25 và rất háo hức với những cơ hội trong tương lai. Chúng tôi thấy rõ tiềm năng tăng trưởng vượt bậc về hiệu suất năng lượng trong những năm tới."
