Sau thành công ấn tượng của Ryzen 7 9800X3D, AMD đã đưa công nghệ này vào ba thế hệ sản phẩm (Zen 3, Zen 4, Zen 5). Trước khi đi sâu vào chi tiết, tôi cần nhấn mạnh rằng X3D mang lại lợi ích cho TẤT CẢ CÁC LOẠI ỨNG DỤNG, không chỉ riêng trò chơi. Tuy nhiên, vì cách thức quảng bá và đối tượng khách hàng mà AMD hướng đến, phần lớn người dùng chỉ chú ý đến X3D khi nhắc đến game. Dù suy nghĩ này không sai, nhưng nó chưa phản ánh đầy đủ bản chất của vấn đề.Mối quan hệ giữa CPU và phần mềm/ứng dụng
Một điều có thể bạn đã biết nhưng vẫn đáng nhắc lại: CPU là phần cứng, còn phần mềm là các chương trình và phần mềm cần phần cứng để thực hiện các yêu cầu từ người dùng. Tuy nhiên, ta cũng có thể nhìn nhận hai yếu tố này theo một cách khác: CPU giống như một nhà máy sản xuất của cải vật chất, còn phần mềm là các công ty thuê nhà máy đó. Tất nhiên, người dùng là đối tượng cuối cùng được phục vụ.
Để dễ hiểu hơn, người dùng đưa ra yêu cầu về một sản phẩm, công ty chịu trách nhiệm thương hiệu sẽ nhận yêu cầu đó, sau khi xử lý họ tạo ra các yêu cầu mới và gửi về nhà máy để tiếp tục giải quyết. Tốc độ làm việc của nhà máy (năng suất) chính là yếu tố quyết định thời gian người dùng nhận được sản phẩm mong muốn (chúng ta tạm bỏ qua vấn đề chất lượng sản phẩm). Nếu nhìn vào game, đặc biệt là game 3D, sản phẩm mà người chơi nhận được là các khung hình trên màn hình. Mọi thứ có mượt mà hay không, chuyển cảnh có lag không, các đối tượng có hành xử đúng như đã lập trình hay không... phần lớn phụ thuộc vào năng suất của CPU/GPU (nhà máy) và cách game (công ty) được tối ưu hóa.

Phần mềm nhận yêu cầu từ người dùng, sau đó gửi các lệnh đến CPU để xử lý. Khi CPU hoàn thành, dữ liệu sẽ được trả lại cho phần mềm để tiếp tục gửi lại người dùng.
Điều gì tạo nên sức mạnh của một CPU?
À, chỉ có hai yếu tố chính: silicon và điện 😃
Nói đùa thôi, hai yếu tố trên là nền tảng, giống như xăng/điện và kỹ thuật luyện kim giúp chiếc xe của bạn hoạt động. Như đã đề cập, CPU giống như một nhà máy, còn game và phần mềm là khách hàng của nhà máy đó. Sức mạnh của nhà máy chính là năng suất, tức là trong một khoảng thời gian, nhà máy có thể sản xuất bao nhiêu sản phẩm. Vậy sức mạnh của CPU chính là thời gian mà nó cần để xử lý yêu cầu từ phần mềm và trả lại kết quả?

Tổng quan về hiệu suất của Ryzen 7 9800X3D trên Linux. Chú ý rằng 9700X ở mức tiêu chuẩn (65W) và khi mở khóa TDP (105W). Đồng thời, so sánh với các CPU khác để thấy rằng có rất nhiều yếu tố ảnh hưởng đến sức mạnh tổng thể của một con chip.
Với một chu trình hoạt động liên tục, khi phần mềm nhận được kết quả A từ CPU, nó sẽ tiếp tục gửi yêu cầu BCDEF (tùy thuộc vào người dùng) và CPU sẽ tiếp tục xử lý các yêu cầu đó. Dĩ nhiên, CPU càng trả lời nhanh thì càng mạnh. Các bài kiểm tra benchmark mà chúng ta thường “giao” cho CPU/GPU thực chất là đưa cho chúng một lượng công việc chuẩn hóa để xem chip đó mất bao lâu để hoàn thành. Chip càng mạnh, kết quả trả về càng nhanh. Tương tự, GPU mạnh là GPU có thể xuất nhiều khung hình mỗi giây hơn những GPU yếu (nếu FPS quá thấp, game sẽ bị lag, giật, và người chơi sẽ cảm thấy khó chịu).
Cache, vấn đề dai dẳng trong các con chip xử lý
Khi bạn đọc các bài review hay phân tích về chip, có thể sẽ nhận thấy rằng bộ đệm (cache) thường ít được đề cập. Nguyên nhân không phải vì nó không quan trọng, mà bởi vì cấu trúc của nó quá đơn giản. Kiến trúc SRAM, loại cache phổ biến hiện nay, gần như không thay đổi trong suốt hàng chục năm qua. Từ các chip Pentium 3, Athlon XP, Cell cho đến ARMv7, tất cả đều sử dụng một kiến trúc SRAM giống nhau. Chính vì thế, chẳng có gì mới mẻ để nói khi mà nó vẫn giữ nguyên suốt thời gian dài, chỉ khác biệt ở tiến trình bán dẫn.

Tế bào SRAM 6T (gồm 6 transistor) là loại phổ biến hiện nay. Ngoài ra, còn có các loại SRAM khác như 4T, 5T, 7T, 8T, 9T, 10T. Nhìn chung, càng dùng nhiều transistor thì càng tốn nhiều silicon.
Tuy không được nhắc đến thường xuyên, nhưng điều đó không có nghĩa là không quan trọng. Sự thật là mọi con chip đều cần SRAM, cho dù đó là CPU, GPU, DSP hay modem mạng. Cache vẫn là một thành phần không thể thiếu. Nó giống như việc không ai nhắc đến kế toán, nhưng bất kỳ công ty nào cũng đều cần có kế toán. Quay lại với ví dụ nhà máy, bất kể sản xuất gì, đều cần có kho hàng và bến bãi. Cache chính là kho hàng trong nhà máy chip xử lý.




Dây chuyền sản xuất (trên) và kho hàng (dưới). Để đáp ứng quy mô công nghiệp, diện tích kho hàng phải đủ lớn để tương xứng với năng lực sản xuất. Điều này cũng đúng với chip xử lý và bộ nhớ cache.
Vì sao cache lại quan trọng hơn RAM, SSD, HDD?
Chắc hẳn bạn đang thắc mắc, nếu việc lưu trữ dữ liệu trong cache phức tạp vậy, tại sao không dùng RAM hoặc nơi khác? RAM rẻ hơn nhiều so với CPU mà. Câu trả lời là đúng, chúng ta vẫn dùng RAM và các bộ nhớ khác, nếu không thì RAM có ích gì?
Vấn đề là vậy, hãy tưởng tượng bạn đang ở trong một nhà máy. Mặc dù cache đắt đỏ, nhưng nó lại nằm rất gần với CPU, giống như một kho hàng nhỏ nằm ngay bên cạnh dây chuyền sản xuất, giúp việc di chuyển hàng hoá diễn ra cực kỳ nhanh chóng (với CPU, việc truy xuất cache chỉ mất vài nanosecond). Còn RAM thì giống như một kho bãi ở cảng, bạn phải sử dụng xe tải hay container để vận chuyển hàng đến đó (và tất nhiên, thời gian vận chuyển cũng là một phần của quá trình sản xuất).


So sánh độ trễ và kích thước dữ liệu khi truy cập cache của Ryzen 5800X3D. Phiên bản không phải X3D có độ trễ thấp hơn một chút khi dữ liệu nhỏ (< 32 MB), nhưng khi dữ liệu vượt quá 32 MB, độ trễ tăng mạnh vì phải truy xuất từ RAM. Phiên bản X3D có độ trễ chỉ tăng nhẹ cho đến khi cache đạt 96 MB.
Nếu cache đã hết, CPU sẽ phải lấy dữ liệu từ RAM (giống như cảng). Thời gian chờ để lấy dữ liệu từ RAM lâu hơn gấp 60 - 70 lần so với L1 cache, gấp 30 lần so với L2 cache và gấp 10 lần so với L3 cache. Nếu có thời gian, bạn có thể sử dụng AIDA64 hoặc các công cụ benchmark khác để kiểm tra sự khác biệt về hiệu năng giữa RAM và cache CPU. Ngoài độ trễ, băng thông dữ liệu của cache có thể đạt tới hàng ngàn GB/s, trong khi RAM chỉ đạt vài chục GB/s.
Đây là lý do tại sao X3D của AMD, với chỉ 64 MB (phiên bản hiện tại), lại có giá trị cao hơn nhiều so với những thanh RAM dung lượng 8 GB hay 16 GB. Thường thì bạn không thấy sự khác biệt lớn trong hiệu năng khi nâng cấp RAM (trừ khi benchmark một ứng dụng đơn lẻ, còn nếu chạy nhiều ứng dụng thì nhiều RAM sẽ có lợi hơn).

Chạy benchmark RAM và cache trên AIDA64 cho thấy sự khác biệt rõ rệt về độ trễ và băng thông giữa chúng.
