Xem nhanh
Tiền ảo sụp đổ
Ada Lovelace
DLSS 3
Game cổ với ray tracing
Bước khởi đầu cho năm 2023
Năm 2022 là một năm đầy biến động đối với NVIDIA, từ việc đối mặt với tình trạng tồn kho quá nhiều card đồ họa kiến trúc Ampere, đến sự sụp đổ của thị trường do tiền ảo, và cuối cùng là sự ra mắt thành công của Ada Lovelace với RTX 4090. Sức mạnh thống trị của đội xanh lá trong lĩnh vực đồ họa tiêu dùng không thể phủ nhận, từ tính ổn định, hiệu suất xuất sắc đến tính tương thích và hỗ trợ cho các phần mềm chuyên dụng. Dù gặp phải một số vấn đề khó khăn như sự cố nóng chảy đầu nguồn 12VHPWR, nhưng nói chung, năm 2022 đã là một năm thành công đối với NVIDIA.Tình trạng sụp đổ của tiền ảo
Trải qua không chỉ một nửa đầu năm 2022 mà còn trong khoảng 2 năm trước đó, việc sở hữu một chiếc card đồ họa cho máy tính cá nhân trở nên khó khăn đối với người tiêu dùng do cơn sốt tiền ảo. Giá cả không chỉ quá cao mà còn có hàng hiếm, đến mức mà một số người có tiền vẫn không mua được. Các trang trại đào tiền số mọc lên như nấm sau mưa, và những người mỏ cần phải có công cụ đào tiền để làm việc trên đất của mình. Vì vậy, trong thời gian qua, nguồn cung card đồ họa ở nhiều thị trường luôn không đủ đáp ứng, bất kỳ số lượng card nào được nhập về cũng đã bị mua hết. Tình trạng trở nên vô lý khi một số card đồ họa cao cấp có giá gần như cả trăm triệu đồng không có hàng để bán, trong khi những mẫu tầm trung và thấp cũng trở nên cực kỳ đắt đỏ. Ví dụ, chiếc GIGABYTE GeForce RTX 3050 Eagle 8G vào tháng 2 có giá từ 13 đến 16 triệu đồng, trong khi giá thực sự của nó nên ở mức phổ thông.
Trước khi thế hệ GPU mới ra đời, kiến trúc Ampere - GeForce RTX 30 Series vẫn là người chiến thắng trên thị trường card đồ họa. Kiến trúc Ampere được cải thiện với thiết kế Streaming Multiprocessor (SM), mỗi SM là một cụm chứa các bộ xử lý đổ bóng (Shader processor). RTX 3000 Series bao gồm 3 loại GPU: GA102 (RTX 3080, RTX 3090), GA104 (RTX 3060 Ti, RTX 3070) và GA106 (RTX 3050, RTX 3060), với số lượng bóng bán dẫn lần lượt là 28 tỉ, 17 tỉ và 12 tỉ, tất cả được sản xuất trên tiến trình 8 nm. Bên trong GPU Ampere là 3 loại nhân xử lý: Programmable Shading Core (nhân đổ bóng có thể lập trình được, mang lại khả năng đổ bóng gấp đôi), Ray Tracing Core (tăng tốc thuật toán Bounding Volume Hierarchy trong quá trình ray tracing) thế hệ 2, Tensor Core (tăng tốc mạng neural AI).
Datapath trên Ampere cũng được cải tiến với thiết kế mới cho phép tính toán FP32 và INT32. Mỗi phân vùng sẽ có một datapath bao gồm 16 nhân shader (shader core) FP32 có thể thực hiện 16 phép tính FP32 mỗi xung; trong khi đó, một datapath khác bao gồm 16 nhân shader FP32 và 16 nhân INT32. Điều này dẫn đến mỗi SM của Ampere có thể đạt được hiệu suất tính toán lên đến 128 phép tính FP32 mỗi xung, gấp đôi so với SM trên Turing.
Mặc dù mạnh mẽ, nhưng không nhiều game thủ có thể trải nghiệm RTX 30 Series do ảnh hưởng của cơn sốt tiền ảo. Cho đến khoảng giữa năm 2022, lượng card đồ họa tràn ra thị trường nhiều hơn, chủ yếu là do Ethereum chuyển từ Proof-of-Work (PoW) sang Proof-of-Stake (PoS), khiến người dùng cuối cơ hội mua card với giá thấp hơn so với trước đó. Tuy nhiên, vấn đề lớn vẫn là lượng card tồn kho khổng lồ, số lượng trâu cày rất nhiều và người dùng thông minh hơn, dẫn đến sức mua giảm mạnh. Cộng đồng người dùng Trung Quốc đang tìm mọi cách để tiêu thụ hàng tồn kho, trong đó có việc sơn lại chip nhớ là phương pháp gần đây nhất.
Ngay trước khi Ada Lovelace ra mắt, thông báo về việc EVGA chia tay NVIDIA đã gây sốc cho cộng đồng. Đối tác 22 năm không còn cung cấp card đồ họa cho đội xanh lá nữa, sau thời gian đầy thách thức từ khía cạnh lợi nhuận, chi phí sản xuất và sự quay lưng từ NVIDIA. EVGA từng chiếm 40% thị phần card đồ họa ở thị trường Bắc Mỹ, và việc thay đổi này sẽ đòi hỏi thời gian để cả người dùng và các thương hiệu khác thích nghi. Điều này cũng có thể là cơ hội cho EVGA hợp tác với AMD hoặc Intel sau khi đánh giá và điều chỉnh lại chiến lược kinh doanh.Ada Lovelace
Tháng 10/2022, kiến trúc Ada Lovelace chính thức ra mắt với dòng card đồ họa GeForce RTX 4090. Dù GPU AD102-300 vẫn chưa hoàn thiện nhưng RTX 4090 vẫn đứng đầu là card đồ họa desktop mạnh nhất cho đến thời điểm đó. Với diện tích đế 600 mm2 và 7 GPC, RTX 4090 sử dụng thiết kế tương tự GA102 của thế hệ Ampere nhưng tích hợp những nhân xử lý mới, tận dụng ưu điểm của tiến trình TSMC 4N. Ada Lovelace có 6 TPC (Texture Processor Cluster) và 2 SM (Streaming Multiprocessor). Mỗi SM được trang bị 4 sub-core, tương tự như GA102 trên RTX 3090 Ti. Một điểm đặc biệt của Ada Lovelace là thiết kế và bố cục nhân xử lý FP32 và INT32. Bên trong GPU của RTX 4090 là 128 SM, tổng cộng 16384 nhân CUDA và 384 ROP. Bộ nhớ đệm L2 của GPU đã được nâng lên 96 MB. Nâng cấp lên Ray Tracing thế hệ 3 và Tensor Core thế hệ 4 giúp RTX 4090 trở nên mạnh mẽ hơn bao giờ hết.
AD102 GPU đầy đủ sở hữu 12 GPC, 72 TPC, 144 SM, và giao diện bộ nhớ đồ họa 384 bit với 12 memory controller 32 bit. Con chip này có 18432 CUDA Core, 144 RT Core, 576 Tensor Core và 576 Texture Unit. GPC là khối phần cứng hàng đầu trong GPU Ada Lovelace, chứa tất cả các đơn vị xử lý đồ họa chính. Mỗi GPC gồm 1 Raster Engine, 2 phân vùng ROP (mỗi phân vùng chứa 8 đơn vị ROP riêng lẻ) và 6 TPC. Mỗi TPC bao gồm 1 PolyMorph Engine và 2 SM. Mỗi SM trong AD10x GPU có 128 CUDA Core, 1 RT Core thế hệ thứ 3, 4 Tensor Core thế hệ thứ 4, 4 Texture Unit, Register File dung lượng 256 KB và bộ nhớ chia sẻ L1 128 KB. Cache L1 dung lượng 18432 KB tăng 71% so với GA102. Cache L2 trên Ada với 98304 KB, gấp 16 lần so với thế hệ trước, mang lại lợi thế đáng kể cho các ứng dụng và tác vụ phức tạp như ray tracing.
Tiến trình sản xuất TSMC 4N đã mở ra cánh cửa cho NVIDIA để tích hợp một lượng lớn nhân vào AD10x, đặc biệt là AD102 với số lượng CUDA Core tăng đến hơn 70% so với GA102, tổng cộng 76.3 tỉ transistor, biến nó trở thành một trong những con chip phức tạp nhất từng được sản xuất. AD102 hoạt động ở tốc độ boost lên đến 2.52 GHz nhưng vẫn duy trì mức tiêu thụ năng lượng hiệu quả, mang lại hiệu năng mỗi watt điện đáng kinh ngạc. So với RTX 3090 Ti, RTX 4090 đạt hiệu năng gấp đôi với cùng mức năng lượng tiêu thụ.
Ngay sau RTX 4090 là RTX 4080, nhưng mặc dù vậy mức độ chấp nhận từ thị trường không cao. Sản phẩm chỉ bán được 30,000 đơn vị so với 130,000 của mẫu card đầu bảng. Điều này có thể giải thích bởi sự chênh lệch hiệu năng lớn giữa chúng, khiến cho nhiều người dùng chọn chi trả thêm để sở hữu RTX 4090. RTX 4090 đã thu hút nhiều người dùng, đặc biệt là những ai cần hiệu năng cao để chơi game 4K 120 Hz hoặc thậm chí là 8K, cũng như những người muốn nâng cấp từ RTX 3090 Ti.DLSS 3
DLSS - Deep Learning Super Sampling - ra đời từ tháng 2/2019, đã ra mắt thế hệ thứ 3. Không chỉ tăng tốc độ khung hình, DLSS còn củng cố thêm khi kích hoạt ray tracing, trở thành 1 yếu tố quan trọng trong trải nghiệm gaming. DLSS giúp tăng tốc độ khung hình và cải thiện chất lượng hình ảnh khi chơi game, thậm chí làm cho hình ảnh trở nên mượt mà và rõ ràng hơn cả render ở độ phân giải gốc. DLSS 3, kèm theo cụm chip xử lý Optical Flow Accelerator, đánh dấu bước tiến mới của đồ họa AI trong ngành giải trí tương tác.
NVIDIA đã tích hợp tất cả kinh nghiệm từ hai thế hệ trước để phát triển DLSS 3 với nhân Optical Flow Accelerator. Quá trình xử lý hình ảnh được cải thiện với Tensor Core và Optical Flow Accelerator, giúp tạo ra khung hình mới hoàn toàn dựa trên dữ liệu motion vector. Điều này mang lại hiệu suất cao hơn và mượt mà hơn trong trải nghiệm chơi game.
Thử nghiệm thực tế cho thấy Tensor Core thế hệ 4 trên RTX 4090 kết hợp với Optical Multi Frame Generation hoạt động mạnh mẽ. Tốc độ khung hình với DLSS 3 bật sẽ tăng gấp 3 lần so với tắt, đôi khi còn nhanh hơn gấp đôi, mang lại trải nghiệm chơi game mượt mà hơn. NVIDIA Reflex cũng được tích hợp để giảm độ trễ độc quyền, đồng bộ hóa CPU và GPU giúp trải nghiệm chơi game trở nên nhất quán hơn.Trải nghiệm Ray Tracing trong Game cổ điển
Thay vì chỉ là bản remake hoặc remaster, Portal RTX đã làm mới hoàn toàn trải nghiệm của mình với công nghệ Ray Tracing. Dù được xây dựng trên nền tảng cũ hơn 15 năm, Portal RTX không thể sánh kịp với các tựa game hiện đại, nhưng sẽ mang lại trải nghiệm mới mẻ với Ray Tracing. Đồng thời, đây cũng là cách để NVIDIA thể hiện sức mạnh của dòng RTX 40 Series, đặc biệt là RTX 4090, với thành công rực rỡ.
Khi áp dụng Ray Tracing theo thời gian thực, cảnh quan trong Portal RTX không chỉ được cải thiện về mặt ánh sáng, đổ bóng và phản chiếu, mà còn tăng tính tương tác của ánh sáng với các bề mặt khác nhau. Cường độ sáng của các khu vực cũng trở nên chân thực và mềm mại hơn, nhờ vào sức mạnh của Ray Tracing. Portal RTX mang đến không gian game sáng sủa hơn, tạo ra một trải nghiệm đầy thú vị và hấp dẫn hơn.
Công nghệ khử nhiễu hình ảnh và xử lý ánh sáng bằng ray tracing đang mang lại hiệu quả đáng kinh ngạc. Anh em không cần hiểu biết sâu rộng về công nghệ này, chỉ cần thưởng thức thành quả của sự nỗ lực phát triển từ các kỹ sư của NVIDIA. Sức mạnh của các công nghệ phụ trợ trong gói phần mềm xử lý ray tracing được tận dụng đến tận cùng. RTX Direct Illumination giả lập con đường của hàng nghìn nguồn sáng và cách chúng tương tác với môi trường, còn PBR mô phỏng chân thực bề mặt vật thể dựa trên chất liệu thực tế. Kết quả là khung cảnh trong Portal RTX trở nên sống động hơn, từ các bức tường đến mặt nước, kết hợp với đổ bóng và hình ảnh phản chiếu, tạo nên một không gian đầy chất thơ mộng.
Portal RTX là minh chứng cho sự tiên phong của ray tracing trong ngành giải trí tương tác. Đây là sự khẳng định rằng ray tracing sẽ tiếp tục là tương lai không thể phủ nhận của ngành này, ít nhất cho đến khi có công nghệ mới xuất hiện.