
Với các kết quả benchmark chính thức từ Ryzen 7 9700X và Ryzen 5 9600X, kiến trúc Zen 5 đã tạo nên một bước ngoặt quan trọng trong lịch sử phát triển vi xử lý x86 của AMD.
Năm nay thực sự là một năm sôi động trên thị trường vi xử lý toàn cầu, khi các ông lớn lần lượt công bố những sản phẩm chủ chốt đã được chuẩn bị nhiều năm qua. Ai sẽ là người chiến thắng trong cuộc đua năm 2024? Còn quá sớm để trả lời. Trong bài trước, tôi đã phân tích sơ lược về kiến trúc Lion Cove (thuộc Lunar Lake & Arrow Lake) của Intel, hôm nay chúng ta sẽ đi sâu vào Zen 5 - một cuộc cách mạng lớn nhất của AMD kể từ khi Zen đầu tiên ra mắt 7 năm trước.
Có thể bạn thắc mắc Zen 5 có gì đặc biệt, không phải nó chỉ là thế hệ tiếp theo của Zen 4 sao? Đúng, nhưng Zen 5 không chỉ vượt trội hơn Zen 4 mà còn vượt qua cả các thế hệ Zen 1/2/3, những thế hệ đã làm nên thành công của AMD suốt 7 năm qua. Dù đã cứu AMD khỏi nguy cơ phá sản, các thế hệ Zen trước giờ đã trở nên lạc hậu. Với sự thay đổi liên tục và cạnh tranh khốc liệt trên thị trường công nghệ, không kiến trúc nào có thể tồn tại mãi mãi - Zen 5 sẽ là khởi đầu mới cho AMD, tương tự như cách mà Zen 1 đã giúp công ty lột xác từ kiến trúc Bulldozer đầy tai tiếng.
Nhắc lại lịch sử, Bulldozer là kiến trúc mà AMD đã đặt rất nhiều kỳ vọng để phát triển, so với kiến trúc K7 trước đó. Tuy nhiên, nhiều năm đua tranh với Intel, đặc biệt về dây chuyền bán dẫn, đã khiến AMD bị tụt lại. Vào năm 2010, AMD thường xuyên thua lỗ, dẫn đến quá trình thiết kế Bulldozer bị gián đoạn. Cuối cùng, công ty đã phải sử dụng các công cụ thiết kế tự động (thay vì kỹ sư trực tiếp điều chỉnh), dẫn đến số lượng transistor tăng từ 1.2 tỷ lên 2 tỷ!
Năm nay thực sự là một năm sôi động trên thị trường vi xử lý toàn cầu, khi các ông lớn lần lượt công bố những sản phẩm chủ chốt đã được chuẩn bị nhiều năm qua. Ai sẽ là người chiến thắng trong cuộc đua năm 2024? Còn quá sớm để trả lời. Trong bài trước, tôi đã phân tích sơ lược về kiến trúc Lion Cove (thuộc Lunar Lake & Arrow Lake) của Intel, hôm nay chúng ta sẽ đi sâu vào Zen 5 - một cuộc cách mạng lớn nhất của AMD kể từ khi Zen đầu tiên ra mắt 7 năm trước.
Chuyện xưa một chút
Có thể bạn thắc mắc Zen 5 có gì đặc biệt, không phải nó chỉ là thế hệ tiếp theo của Zen 4 sao? Đúng, nhưng Zen 5 không chỉ vượt trội hơn Zen 4 mà còn vượt qua cả các thế hệ Zen 1/2/3, những thế hệ đã làm nên thành công của AMD suốt 7 năm qua. Dù đã cứu AMD khỏi nguy cơ phá sản, các thế hệ Zen trước giờ đã trở nên lạc hậu. Với sự thay đổi liên tục và cạnh tranh khốc liệt trên thị trường công nghệ, không kiến trúc nào có thể tồn tại mãi mãi - Zen 5 sẽ là khởi đầu mới cho AMD, tương tự như cách mà Zen 1 đã giúp công ty lột xác từ kiến trúc Bulldozer đầy tai tiếng.
Nhắc lại lịch sử, Bulldozer là kiến trúc mà AMD đã đặt rất nhiều kỳ vọng để phát triển, so với kiến trúc K7 trước đó. Tuy nhiên, nhiều năm đua tranh với Intel, đặc biệt về dây chuyền bán dẫn, đã khiến AMD bị tụt lại. Vào năm 2010, AMD thường xuyên thua lỗ, dẫn đến quá trình thiết kế Bulldozer bị gián đoạn. Cuối cùng, công ty đã phải sử dụng các công cụ thiết kế tự động (thay vì kỹ sư trực tiếp điều chỉnh), dẫn đến số lượng transistor tăng từ 1.2 tỷ lên 2 tỷ!

Sơ đồ khối của kiến trúc Bulldozer với 2 cụm INT và 1 FPU
Bên cạnh vấn đề 'lạm phát' transistor, Bulldozer còn gặp phải một điểm yếu không thể khắc phục là 'tầm nhìn' của AMD vào thời điểm đó. Thay vì thiết kế một nhân INT (số nguyên) lớn như Intel, các kỹ sư AMD đã chọn chia thành 2 nhân INT nhỏ và thêm một nhân FPU. Dù CMT (Clustered Multi Threading) tạo ra nhiều nhân thực hơn SMT (Simultaneous Multithreading hay Hyper Threading), nhưng điểm yếu là các nhân thực này quá yếu. Thực tế, một nhân INT K10 có tới 3 ống lệnh, trong khi một nhân INT Bulldozer chỉ có 2 ống lệnh! Kết quả là con chip 8 nhân Bulldozer đôi khi kém hơn cả con chip 6 nhân K10…
Tuy nhiên, nhiều chuyên gia IT cho rằng số lượng nhân xử lý thực sự tính theo số lượng FPU, không phải INT. Họ cho rằng chip Bulldozer thực chất chỉ có 4 nhân (vẫn xử lý được 8 luồng). Nếu marketing theo cách này, Bulldozer không quá tệ. Nhưng lãnh đạo AMD lúc đó khá bảo thủ và cái giá của sự bảo thủ thường là thất bại.
Các phiên bản nâng cấp của Bulldozer sau này, như Piledriver, Steamroller, Excavator (khi Lisa Su đã lãnh đạo AMD) có cải thiện hơn thế hệ đầu tiên, nhưng vì vẫn dựa trên triết lý nhân yếu, chúng vẫn chỉ đứng ở vị trí dưới so với dòng Core của Intel. Việc thay đổi cấu trúc cơ bản là cần thiết cho sự sống còn của công ty.
Zen 'thế hệ đầu' - Sự trở lại của big core
Như bạn đã thấy, những sai lầm từ đầu có thể gây hậu quả nghiêm trọng và kéo dài nhiều năm, ảnh hưởng đến sự tồn tại của cả một công ty. Có thể nói, những năm đầu Lisa Su nắm quyền tại AMD là thời kỳ dọn dẹp những rắc rối mà các CEO trước đó (Dirk Meyer, Rory Read) để lại. Đây cũng là giai đoạn AMD chủ yếu bán chip cho game console để duy trì hoạt động, trong khi chờ đợi canh bạc lớn với Zen, mà nếu thất bại thì sẽ là cú ngã đau đớn.

Kiến trúc Zen được công bố vào năm 2016 và ra mắt sản phẩm vào năm 2017
Thực tế, kiến trúc Zen khá tương tự Skylake của Intel, nhưng đơn giản hơn một chút. Vào năm 2017, câu hỏi chính là liệu AMD có thể tiếp tục sản xuất chip x86 hay không, thay vì có thể làm sản phẩm tốt hơn Intel. Bên cạnh việc Zen từ bỏ CMT của Bulldozer để theo SMT như Intel, Lisa Su còn có một lợi thế quan trọng là chiplet!

Kiến trúc Zen 4 sau 7 năm đổi mới
Tuy nhiên, công nghệ là một sân chơi khắc nghiệt; nếu AMD không tiếp tục cải tiến và chỉ dừng lại ở chiến thắng hiện tại như đối thủ, lịch sử sẽ lặp lại…
Những thử thách mới
Thực tế, việc phát triển một kiến trúc hoàn toàn mới không phải là chuyện ngày một ngày hai. Hầu hết các công ty như AMD và Intel đều duy trì ít nhất 2 nhóm kỹ sư chuyên biệt để thiết kế chip theo dạng luân phiên: một nhóm tập trung vào kiến trúc chính (với lộ trình khoảng 5 năm) và một nhóm làm việc để nâng cấp và cải tiến từ kiến trúc đó (tương tự như việc cập nhật phần mềm hàng năm với các bản sửa lỗi và tính năng mới). Ví dụ, để phát triển Zen 1 (ra mắt năm 2016), Lisa Su đã phải lên kế hoạch từ ngay khi gia nhập AMD vào năm 2012. Do đó, việc ra mắt Zen 5 cũng cần được chuẩn bị từ năm 2020 trở đi.

Ban lãnh đạo AMD khi bắt đầu giới thiệu Zen
Điều này có nghĩa là để hình dung Zen 5, cần phải có sự chuẩn bị và tầm nhìn từ nhiều năm trước, không phải đợi khi Qualcomm ra Snapdragon X hay Intel công bố Lunar Lake, Arrow Lake thì AMD mới bắt đầu hành động. Điều này đòi hỏi khả năng dự đoán và tầm nhìn chiến lược từ lãnh đạo (như thất bại của tầm nhìn Bulldozer vào năm 2010 đã chứng minh). Khi kiến trúc Zen 5 chính thức ra mắt, rõ ràng đây là một quyết định rất đúng đắn!
Như đã đề cập trong phân tích về Lunar Lake với nhân Lion Cove, cả AMD và Intel đang đối mặt với áp lực lớn từ đối thủ Arm, đặc biệt là Apple và Qualcomm. Các sản phẩm RISC đã trang bị decoder 8/10-wide trong khi x86 chỉ mới đạt 4/6-wide. Dù kích thước decoder không hoàn toàn xác định sức mạnh của kiến trúc, nhưng nó phản ánh khả năng IPC (tối đa) mà kiến trúc đó có thể đạt được. Nếu AMD hoặc Intel không nâng cấp kích thước decoder để ít nhất ngang bằng với Arm, việc cạnh tranh sẽ rất khó khăn. Intel đã từng bước nâng kích thước từ 4-wide (Skylake) lên 5-wide (Cypress Cove), 6-wide (Redwood Cove), và mới đây là 8-wide (Lion Cove).


Zen không thể so sánh với Skylake về hiệu suất đơn luồng nhưng vượt trội trong đa luồng nhờ vào số lượng nhân xử lý nhiều hơn
Còn về phần AMD, trong suốt 7 năm qua công ty này vẫn duy trì 4-wide (Zen 1, 2, 3, 4). Thực tế, Bulldozer cũng là 4-wide decoder nhưng do thiết kế 'chia đôi' INT nên không hoàn toàn đạt tiêu chuẩn 4-wide. Điều này khiến tôi từng lo lắng rằng AMD sẽ gặp khó khăn trong việc nâng cấp decoder vì CISC không dễ dàng thay đổi. Ngay cả việc nâng lên 6-wide hiện tại cũng không đơn giản với AMD (hãy xem Intel đã tăng dần như thế nào).
Thế nhưng…
Zen 5 đã đạt đến 8-wide. Thật sự ấn tượng!
Những thông tin cũ, nhưng vẫn còn giá trị
Khi theo dõi sự kiện của AMD tại Computex, tôi vừa ngạc nhiên vừa bất ngờ với cách công ty này 'lách luật' decoder. Nó gợi nhớ lại thiết kế Bulldozer của AMD và cũng khiến tôi nghĩ đến E-Core Gracemont của Intel. Tuy nhiên, điều đáng lưu ý là Intel sử dụng E-core chủ yếu để tiết kiệm năng lượng, trong khi AMD áp dụng Zen 5 như một P-core 'thực thụ'. Thay vì sử dụng một decoder 8-wide lớn và phức tạp, tại sao không chia thành 2 decoder 4-wide?
Nếu bạn là fan của Intel, có thể bạn sẽ cho rằng AMD đã học theo chiêu của E-core, nhưng tôi tin rằng ý tưởng này có nguồn gốc từ Bulldozer. AMD đã nhiều lần làm ngành công nghệ ngạc nhiên với các giải pháp đơn giản nhưng hiệu quả, chẳng hạn như bộ mở rộng AMD64 cho kiến trúc x86, cho phép hỗ trợ xử lý 64-bit mà không cần phải thiết kế lại toàn bộ như IA64 của Intel. Kết quả là Itanium đã không thể cạnh tranh nổi với sự đơn giản của x86-64 (AMD64).
Và lần này, AMD đã giới thiệu bộ decoder 4-wide đôi!

E-core Gracemont của Intel cũng sử dụng 2 decoder độc lập
Tuy nhiên, tôi không khẳng định rằng phương pháp của Intel (hoặc Apple, Qualcomm) tốt hơn hay AMD tốt hơn. Đây cũng giống như việc so sánh động cơ 300 cc với 1 piston lớn so với 2 piston nhỏ. Hiệu quả thực tế còn phụ thuộc vào nhiều yếu tố khác. Mặc dù cùng là 4-wide decoder, hệ số IPC giữa các thế hệ Zen 1, 2, 3 và 4 có sự khác biệt rõ rệt. Tương tự, Zen 6, 7… dù có cùng loại decoder như Zen 5 nhưng hiệu quả có thể vẫn khác.
Phân tích kiến trúc AMD Zen 5 - Cải tiến lớn nhất kể từ Zen 'đời đầu' (phần 2)