Ngoài việc giới thiệu kiến trúc chip xử lý máy tính cá nhân Lunar Lake, Intel cũng đã công bố kiến trúc chip GPU xử lý đồ họa Xe2 mới tại sự kiện Computex 2024. Đầu tiên, Xe2 sẽ hiện diện trên những con chip Lunar Lake dưới dạng iGPU tích hợp. Sau đó, những card và chip đồ họa rời Batlemage dành cho laptop cũng như máy bàn sẽ lần lượt được ra mắt.Tại sự kiện ITT 2024, Intel đã khẳng định không hủy bỏ dự án phát triển GPU và card đồ họa Arc cho người dùng tiêu dùng. Tom Petersen đã có một bài thuyết trình đầy đam mê về thế hệ kiến trúc Xe2. Thay vì sử dụng các khái niệm như LP, LPG, HP và HPG, Intel gọi tất cả sản phẩm GPU kiến trúc mới của mình là Xe2. Tuy nhiên, các sản phẩm dành cho các phân khúc khác nhau vẫn sẽ được phân biệt bằng codename riêng.
Intel cho biết, với kiến trúc Xe2, tương tự như Xe, có khả năng mở rộng quy mô die bán dẫn để đa dạng hóa giải pháp sản phẩm, từ iGPU tích hợp đến card đồ họa cao cấp phục vụ nhu cầu chơi game, và cả phục vụ xử lý workstation cũng là mục tiêu của Intel.
Chi tiết kiến trúc từng nhân Render Slice
Về mặt chi tiết, nhân GPU Xe thế hệ thứ 2 sở hữu tài nguyên điện toán hỗ trợ engine SIMD16 để cải thiện hiệu quả vận hành. Một nhân GPU Xe2 bao gồm:- 8 Vector Engine 512-bit
8 XMX Engine 2048-bit
Hỗ trợ 64b atomic ops
Bộ nhớ đệm 192kB L1$/SLM

- SIMD16 native ALU, hỗ trợ vận hành SIMD16 và SIMD32
Xe Matrix Extensions hỗ trợ xử lý phép tính số thực dấu phẩy động INT2, INT4, INT8, FP16, BF16
Mở rộng khả năng xử lý phép tính FP64
Vận hành đồng thời FP + INT/EM và XMX
XMX, viết tắt của Xe Matrix Engines trước đó đã hiện diện trên kiến trúc Xe Alchemist, nhưng giờ được nâng cấp, hỗ trợ nhiều dạng dữ liệu hơn, và vận hành tính toán số thực dấu phẩy động FP16 và INT8 nhanh hơn nhiều, FP16 đạt ngưỡng 2048 OPS trên mỗi xung nhịp, INT8 đạt 4096 OPS trên mỗi xung nhịp.
Giờ là lúc nói đến cách Intel bố trí Vector Engine và Xe Matric Engine trong mỗi nhân Render Slice, một cụm nhân tính toán cơ bản bên trong GPU Xe2. Những Render Slice này có thể được xếp chồng lên nhau ở quy mô lớn, số lượng tùy thuộc vào nhu cầu xử lý đồ họa hay thuật toán số thực dấu phẩy động, rồi tối ưu để giảm độ trễ, cải thiện vận hành kết hợp giữa phần cứng và phần mềm. Những Render Slice này được kết nối trực tiếp với Command Front End với vai trò chia việc, hỗ trợ Execute Indirect.
Trong từng nhân Render Slice này có Geometry Engine mới, hiệu năng xử lý đa giác vertex và mesh shading tăng gấp 3 so với kiến trúc Xe, bộ nhớ đệm L1$/SLM mới để lấy mẫu đa giác và texture bề mặt vật thể theo kiểu không tuần tự. Cụm chip Pixel Backends biến đa giác vector thành điểm ảnh hiển thị trên màn hình có băng thông tăng gấp đôi, bộ nhớ đệm màu sắc điểm ảnh tăng 33%.Cụm nhân ray tracing được nâng cấp
Trên nhân GPU Xe2, một phần lớn diện tích transistor silicon được dành cho cụm RTU, ray tracing unit, với 3 traversal pipeline, 18 box intersection và 2 triangle intersection, cùng vận hành để xử lý tính toán đường đi của ánh sáng và cách ánh sáng tương tác với bề mặt các vật thể trong màn chơi của các game.
Cụm nhân ray tracing trên GPU Xe2 có kích thước lớn hơn, đảm bảo đủ transistor xử lý những hiệu ứng đồ họa đòi hỏi phần cứng máy tính nhất hiện giờ. Kiến trúc GPU Xe2 được thiết kế để vận hành game tốt hơn, tối ưu xử lý để tốc độ khung hình game cao hơn. Cụm nhân Execute Indirect chia lệnh xử lý không tuần tự, những lệnh này được ứng dụng rất nhiều trong những trò chơi phổ biến, hay những tác phẩm vận hành dựa trên bộ công cụ Unreal Engine.
iGPU kiến trúc Xe2 trên chip Lunar Lake
Sản phẩm đầu tiên được trang bị nhân iGPU kiến trúc Xe2 là chip xử lý Lunar Lake. Vài cụm nhân xử lý chuyên trách trên die chip Lunar Lake vận hành trực tiếp với iGPU Xe2, bao gồm cụm Media Engine xử lý codec hay Display Engine xử lý đưa hình ảnh lên màn hình.
Trên những chip Lunar Lake dành cho laptop ra mắt trong năm nay, tile iGPU kiến trúc Xe2 sẽ có cấu hình như sau:- 8 nhân Xe2
64 Vector Engine
2 Geometry Pipeline
8 Sampler
4 Pixel Backend
8 Ray tracing unit
8MB cache L2
Trên mỗi nhân Xe2 là 8 Xe Matrix Engine, 8 Vector Engine, một cụm nhân Load/Store dữ liệu, một cụm nhân xử lý đa luồng Thread SortingUnit, và bộ nhớ đệm L1 riêng. So với những nhân iGPU tích hợp trên chip Meteor Lake, nhân iGPU kiến trúc Xe2 trên chip Lunar Lake mang lại hiệu năng cải thiện tới 50% và tiêu thụ điện năng giảm mạnh.
Bên cạnh nhân NPU, iGPU Xe2 vẫn có cụm xử lý tính toán ma trận, tổng cộng chúng sở hữu tốc độ 67 TOPS xử lý số thực INT8, kết hợp với sức mạnh 48 TOPS của nhân NPU thế hệ 4, và 5 TOPS của CPU, tạo ra tổng sức mạnh 120 TOPS trên toàn bộ con chip xử lý, phục vụ vận hành tính năng AI hay trợ lý ảo AI kèm theo chuẩn Copilot+ PC của Windows 11 mà Microsoft vừa công bố.
Xe Display Engine trên Intel Lunar Lake
Display Engine là một cụm nhân xử lý độc lập so với iGPU kiến trúc Xe2 trên chip Lunar Lake. Trên die chip này có 3 Display Pipes xử lý hình ảnh gửi lên màn hình, hỗ trợ xuất tín hiệu tối đa 8K60 HDR, hoặc tối đa 3 màn hình 4K60, hỗ trợ màn hình 1080p và 1440p ở tần số quét tối đa 360Hz. Display Engine mới hỗ trợ HDMI 2.1, DisplayPort 2.1 và eDP1.5 cho màn hình laptop.
Display Engine tích hợp cụm nhân xử lý Decode/Decrypt và Streaming Buffer Zone. Cụm chip xử lý điểm ảnh và màu sắc điểm ảnh hiển thị lên màn hình hỗ trợ color conversion, vừa đảm bảo tiêu thụ điện năng ở mức thấp nhất.
Display Engine cũng có tính năng tiết kiệm điện với Panel Replay, ngắt điện tạm thời khi không có chuyển động trên màn hình. Cảm biến độ sáng màn hình áp dụng công nghệ LACE (Local Adaptive Contrast Enhancement). Đối với mã hóa, nén và giải mã tín hiệu hình ảnh, Display Engine sử dụng display stream compression engine, mã hóa tín hiệu hình ảnh theo chuẩn HDMI và DisplayPort mới nhất.
Như đã đề cập trước đó, Display Engine của chip Lunar Lake hỗ trợ chuẩn tín hiệu hình ảnh eDisplayPort 1.5 với Panel Replay, một công nghệ nâng cấp toàn diện đối với tần số làm mới màn hình laptop. Đơn giản hơn, màn hình sẽ mượt mà hơn, tiêu thụ điện năng thấp hơn, giữ cho pin của laptop sử dụng được lâu hơn.
Động cơ Phương tiện truyền thông
Một phần khác của chip Lunar Lake là Động cơ Phương tiện truyền thông, hỗ trợ xử lý giải mã và mã hóa các codec phổ biến và mới nhất. Động cơ Phương tiện truyền thông kết nối trực tiếp với nhân iGPU Xe2, bộ nhớ cache 8MB. Bộ nhớ cache này giúp chip Lunar Lake tiết kiệm băng thông bộ nhớ, giảm lượng dữ liệu cần truyền qua lại RAM khi xử lý Phương tiện truyền thông. Đồng thời, việc này cũng giúp giảm năng lượng tiêu thụ đáng kể khi xử lý mã hóa codec Phương tiện truyền thông, đặc biệt là khi sử dụng máy tính để xử lý nội dung truyền hình bằng Premiere hay CapCut chẳng hạn

Media Engine hỗ trợ giải mã video 8K60 10-bit HDR, cho phép mã hóa 8K60 10-bit HDR, AVC, VP9, H.265 HEVC, AV1 và cả VVC mới. VVC Engine giúp giảm bitrate nhưng vẫn đảm bảo chất lượng video như chuẩn codec AV1, Intel cho biết video codec VVC có dung lượng thấp hơn video AV1 khoảng 10%.
Cuối cùng, kết hợp tất cả phần cứng với nhau, iGPU Xe2 của Intel sẽ hoạt động thông qua software stack của Windows, được tối ưu cho phần cứng mới. Trước đó, Intel đã dành rất nhiều thời gian để tối ưu hiệu suất ở tầng API của kiến trúc Xe cũ, đặc biệt là hiệu suất xử lý game với API DirectX 9 cũ. Mọi cải tiến và tối ưu đó sẽ được áp dụng cho kiến trúc Xe2, điều này có nghĩa là người dùng iGPU và GPU của Intel sẽ không phải chờ đợi như trước nữa.
