
Dù thời gian thống trị của Granite Rapids trên thị trường CPU máy chủ khá ngắn, không thể phủ nhận rằng sản phẩm này vẫn là một mảnh ghép quan trọng của Intel, mang nhiều ý nghĩa trong bối cảnh hiện tại. Một điều không thể chối cãi lúc này là AMD đang nắm giữ chip server mạnh nhất thế giới. Với kiến trúc Zen 5 và tiến trình TSMC N4/N3, dòng EPYC 9005 Turin đang vượt qua mọi đối thủ, từ các dòng sản phẩm mới của năm ngoái đến cả những kẻ cựu thù của x86 và các đại diện từ Arm. Tuy vậy, đứng ở vị trí cao không có nghĩa là AMD có thể hoàn toàn yên tâm, khi vẫn cần phải dè chừng những đối thủ mạnh mẽ khác. Xeon 6900P hay Granite Rapids có thể không thể so sánh với Turin, nhưng câu chuyện chưa kết thúc. Trong các phần tiếp theo của bài viết, chúng ta sẽ cùng đi sâu vào phân tích Granite Rapids và dự đoán xu hướng của thị trường server trong những năm tới.

Trước khi Internet xuất hiện, mainframe là những cỗ máy khổng lồ lưu trữ hầu hết dữ liệu quan trọng
Khoảng nửa thế kỷ trước, khi Internet chỉ mới ở giai đoạn đầu và chưa có cảnh con người sử dụng điện thoại thông minh để truy cập thông tin hay giải trí, các hệ thống máy tính đã tồn tại dưới dạng các cỗ máy độc lập, liên kết với nhau không mấy chặt chẽ. Chúng ta đã có các thiết bị như băng VHS, đĩa mềm, đĩa cứng, đĩa quang, máy in, và cả máy fax để trao đổi dữ liệu qua đường điện thoại. Tuy nhiên, những chiếc mainframe khổng lồ đóng vai trò như "trái tim" của các công ty thời đó, nơi mọi dữ liệu quan trọng được lưu trữ, xử lý và chia sẻ. Ban đầu, do chưa có Internet, mainframe chủ yếu hoạt động trong các mạng nội bộ. Khi Internet trở nên phổ biến, thuật ngữ 'server' dần thay thế mainframe và trở thành một phần không thể thiếu trong công nghệ hiện đại. Mainframe giờ đây trở thành một thuật ngữ hiếm gặp, ít được sử dụng nữa.

Cảnh tượng kinh điển khi Neo đối mặt với Architect, giải thích toàn bộ về sự tồn tại của Matrix
Nếu bạn đã từng xem series Matrix (ngoại trừ phần 4 kém hấp dẫn), chắc chắn bạn sẽ thấy thuật ngữ mainframe xuất hiện khá nhiều trong các cuộc đối thoại, và thực tế, nó mang ý nghĩa tương đương với server mà chúng ta đang sử dụng hiện nay. Mỗi khi bạn kết nối Internet để tìm kiếm thông tin hay xem video, bạn thực sự đang "cắm vào" hệ thống (plug into the matrix).
Nhắc đến mainframe và server từ "thời xưa" cho đến nay, điều quan trọng nhất bạn cần hiểu là ở bất kỳ thời kỳ nào trong ngành công nghệ thông tin, một cỗ máy tính mạnh mẽ và hoạt động liên tục 24/7 là điều không thể thiếu. Dù bạn đang dùng smartphone, máy tính để bàn, máy chơi game, TV thông minh hay ô tô thông minh, bất cứ khi nào bạn cần kết nối vào hệ thống, đều cần có server để hỗ trợ (server - người phục vụ). Có thể nói, IoT sẽ không thể tồn tại nếu không có server. Thậm chí, các phần mềm, ứng dụng hay dịch vụ cloud cũng không thể hoạt động nếu thiếu hạ tầng server. Làm sao VNeID, Shopee hay Tiktok có thể tồn tại mà không có chúng?

Không có server, dù ứng dụng tiên tiến đến đâu cũng không thể hoạt động
Intel và dòng vi xử lý Xeon
Có thể bạn sẽ ngạc nhiên, nhưng dòng vi xử lý Xeon không phải là dòng sản phẩm lâu đời nhất của Intel. Thực tế, phải mất 30 năm sau khi thành lập, Intel mới bắt đầu sản xuất Xeon, vốn là dòng chip server dựa trên kiến trúc x86. Tuy nhiên, không thể không nhắc đến Itanium hay IA-64, ra đời trước Xeon cả một thập kỷ. Tuy vậy, Itanium đã dần trở thành quá khứ và không còn được nhắc đến nhiều. Điều thú vị là Itanium được Intel và HP hợp tác phát triển như một nỗ lực để thâm nhập vào thị trường mainframe, nơi mà các ông lớn như IBM, Sun (Oracle đã mua lại), Siemens, Fujitsu, DEC, NEC... vẫn đang thống trị.

IBM, từ biểu tượng công nghệ đến sự mờ nhạt trong ngày nay
Có một câu chuyện thú vị là dù Intel ban đầu không dự tính sẽ làm x86 thành công rực rỡ như ngày nay, nhưng "tai nạn" x86-64 do AMD khởi xướng lại thay đổi hoàn toàn cục diện công nghệ. Các gã khổng lồ trong ngành mainframe lần lượt ngã gục, khiến thị phần server không-x86 ngày nay chỉ chiếm hơn 10%. Điều đáng chú ý là ngay cả những đối thủ không sản xuất chip x86 như Sun hay IBM cũng phải chuyển sang sử dụng vi xử lý x86 trong sản phẩm của mình. Điều này cho thấy, x86 gần như đã thống trị tuyệt đối trong thế giới server. Nếu theo dõi danh sách siêu máy tính TOP500, rất khó để tìm thấy một hệ thống không sử dụng chip x86 (dù là Xeon hay EPYC/Opteron).

Danh sách TOP500 mới nhất, phần lớn các hệ thống siêu máy tính sử dụng chip x86

IDC đã đưa ra những dự báo và thống kê về thị phần chip server đến năm 2025. Bạn có thể tham khảo thông tin chi tiết tại IDC

Thị phần của các nhà sản xuất server hàng đầu trên thế giới. Nguồn: Statista
Sự suy giảm này bắt nguồn từ chính các quyết định ở cấp cao – sự thiếu ổn định trong ban lãnh đạo. Như tôi đã phân tích trước đây, những thay đổi này ảnh hưởng từ cấp cao cho tới khả năng sản xuất chip. Cả Xeon và Intel đều đang tụt lùi, đặc biệt từ khi Cascade Lake (14 nm) ra mắt. Các thế hệ Xeon sau đó không chỉ ra mắt muộn mà còn kém cạnh so với EPYC, thậm chí thua cả AmpereOne mới của Ampere. Intel thực sự cần phải thay đổi mạnh mẽ nếu không muốn đi theo vết xe đổ của IBM hay Nokia.
Granite Rapids, một hành trình dài để trở lại
Trước khi đi sâu vào các yếu tố kỹ thuật, chúng ta cần phân biệt một số khái niệm liên quan đến thương hiệu và phân khúc thị trường. Xeon 6 thực tế có hai dòng sản phẩm khác nhau: một dòng sử dụng nhân P-core Granite Rapids và dòng còn lại sử dụng nhân E-core Sierra Forest. Đây là bước đi chiến lược quan trọng của Intel, khi họ có thể phục vụ hai nhóm khách hàng server khác nhau: một nhóm cần hiệu năng mạnh mẽ, còn nhóm kia cần hiệu quả chi phí cao. Trước đây, Xeon chỉ có một kiến trúc duy nhất, không thể đáp ứng được tất cả nhu cầu thị trường. Hướng đi này khá giống với AMD, khi họ có các sản phẩm Zen 4/5 và Zen 4c/5c để phục vụ nhiều đối tượng khách hàng khác nhau.

Lộ trình phát triển của Xeon Intel đến năm 2025 sẽ bao gồm hai dòng sản phẩm: P và E
Xeon 6 không chỉ có 6900P hay 6700E, mà đây chỉ là hai dòng sản phẩm đầu tiên sẽ xuất hiện vào năm 2024. Vào năm sau, Intel sẽ tiếp tục giới thiệu thêm các model như 6900E, 6700P, 6500P, 6300P. Điều này cho thấy con số trong tên gọi không phản ánh bản chất của chip mà chỉ là ký tự đuôi P hay E, thể hiện loại nhân sử dụng: P-core hay E-core. Chúng ta sẽ chỉ tập trung vào dòng 6900P, cụ thể là Granite Rapids.

Granite Rapids thực sự mang đến một sự cải tiến mạnh mẽ so với thế hệ trước
Với việc được xây dựng trên nền tảng P-core, đặc biệt là Redwood Cove, Granite Rapids hướng đến thị trường server cao cấp và sẽ thay thế các dòng Sapphire Rapids/Emerald Rapids hiện tại. Xét về mặt hiệu năng, Granite Rapids mạnh mẽ gấp đôi và hiệu suất trên mỗi watt điện cũng cao hơn gấp rưỡi so với Emerald Rapids. Đây là một bước tiến lớn, vì giữa hai thế hệ sản phẩm chỉ cách nhau một năm nhưng chênh lệch về hiệu suất lại rõ rệt đến vậy, điều mà rất ít đối thủ có thể làm được.
Chiplet theo cách riêng của Intel
Một xu hướng không thể tránh khỏi trong năm 2024 và các năm tiếp theo là nếu bạn muốn tạo ra một con chip mạnh mẽ, bạn buộc phải sử dụng kiến trúc chiplet/MCM. Dù thiết kế đơn chip (monolithic) vẫn có thể thực hiện, nhưng khi kích thước chip lớn, hiệu suất bán dẫn giảm mạnh, kéo theo chi phí sản xuất tăng cao và khó đạt được sản lượng lớn. Mặt khác, nếu kích thước không đủ lớn thì chip không thể cạnh tranh về hiệu năng. Vì vậy, dù có muốn hay không, chiplet chính là con đường duy nhất cho Intel nếu họ muốn duy trì vị thế trên thị trường server.

Các phiên bản Granite Rapids khác nhau tùy thuộc vào số lượng die compute mà chúng sở hữu
Tuy nhiên, giữa AMD và Intel vẫn có sự khác biệt rõ rệt trong cách tiếp cận chiplet. Nếu AMD chia nhỏ die CCD rồi kết nối chúng bằng một die I/O lớn ở trung tâm, Intel lại làm ngược lại. Với Intel, die compute (tương tự như CCD) phải lớn và ở trung tâm, trong khi die I/O có thể được chia nhỏ và bố trí xung quanh. Cách làm này giúp Intel dễ dàng kết nối nhiều socket CPU trên cùng một server, thậm chí có thể đạt cấu hình 8P. Trong khi đó, với AMD, mỗi server chỉ có thể gắn tối đa 2 CPU (cấu hình 2P). Tuy nhiên, thực tế cho thấy các cấu hình 4P/8P chiếm thị phần rất nhỏ, bởi hiện nay hầu hết các trung tâm dữ liệu đều ưu tiên sử dụng cấu hình 2P để giảm chi phí đầu tư và vận hành. Đặc biệt, khi cần cài đặt GPU hoặc bộ tăng tốc AI, việc sử dụng nhiều socket CPU lại càng không cần thiết.

Xeon 6900P lý thuyết có thể hỗ trợ cấu hình 8P (8S)
Về thiết kế die compute, Intel vẫn ưa chuộng sử dụng die lớn hơn so với AMD. Cụ thể, trong khi AMD chỉ có tối đa 8 nhân mỗi die CCD (trừ Zen 5c với 16 nhân/CCD), model EPYC 9015 của AMD thấp nhất cũng chỉ có 8 nhân. Còn với Intel, Granite Rapids sở hữu tới 2 loại die compute, với phiên bản LCC thấp nhất có 16 nhân và phiên bản HCC phổ thông lên đến 48 nhân. Chính vì Intel thích sử dụng die lớn nên một nhược điểm là chúng có thể dễ gặp lỗi hơn. Điều này giải thích tại sao phiên bản 2 die compute XCC chỉ có 86 nhân (2x 48 - 10), còn bản cao cấp 3 die compute UCC có 128 nhân (3x 48 - 16). Tóm lại, mỗi sự lựa chọn đều có ưu và nhược điểm, và hoàn hảo là điều không thể đạt được.
Phân tích chi tiết vi xử lý máy chủ Intel Xeon 6900P - Phần 2
