Sự kiện SC (siêu điện toán) hàng năm là nơi giới công nghệ chứng kiến những sáng tạo ấn tượng. Tại SC24, Microsoft giới thiệu hệ thống ảo hoá Azure HBv5, tối ưu cho các ứng dụng HPC. Hệ thống này sử dụng chip Instinct độc quyền từ AMD, kết hợp với hạ tầng mạng Quantum-2 InfiniBand của NVIDIA. Chip MI300C, trước đây được đồn đoán sẽ là tên gọi chính thức, hiện chỉ được sản xuất riêng cho Microsoft.Nền tảng chủ đạo của HBv5 bao gồm kiến trúc Zen 4 và bộ nhớ HBM3. Bạn có thể thắc mắc tại sao Microsoft vẫn sử dụng Zen 4 thay vì Zen 5, mặc dù năm 2024 đã gần kết thúc? Lý do là vì AMD hiện chưa có mẫu Instinct nào trang bị Zen 5. Đến nay, chỉ có các dòng Ryzen 9000 và EPYC 9005 áp dụng kiến trúc này, còn Instinct vẫn dừng lại ở Zen 4. Theo kế hoạch của AMD, thế hệ Instinct mới sẽ ra mắt vào năm 2025, có thể sẽ dùng Zen 5.
Vậy MI300C có điểm gì đặc biệt với Microsoft?
Instinct MI300A là mẫu Instinct duy nhất của AMD được trang bị nhân x86.
Chip MI300C tại SC24
Tại sao Microsoft lại chọn một con chip "đặc biệt" như vậy? Lý do là công ty cần một giải pháp mạnh mẽ với nhiều nhân CPU để chạy ảo hoá cùng băng thông bộ nhớ cực lớn. Bộ nhớ HBM đã có mặt từ lâu (AMD Fury X năm 2015 là mẫu chip đầu tiên sử dụng HBM), nhưng chủ yếu chỉ kết hợp với GPU. Mới đây, Intel giới thiệu CPU Sapphire Rapids có phiên bản kèm HBM2e, nhưng một số vấn đề về lộ trình sản phẩm của Intel có thể đã khiến Microsoft tìm đến AMD. Dưới sự lãnh đạo của Lisa Su, AMD cũng đã có kinh nghiệm trong việc tạo ra các thiết kế chip tùy chỉnh, ví dụ như cho Xbox và PlayStation.
Ngoài ra, Azure đời cũ cũng đã sử dụng chip EPYC của AMD, nên việc tiếp tục hợp tác với AMD cũng là điều dễ hiểu.

So sánh băng thông bộ nhớ giữa các thế hệ Azure HBv


Hệ thống HBv5 gồm 4 chip MI300C
