Unified Memory là một công nghệ mới xuất hiện trên các máy tính sử dụng chip Apple Silicon như M1, M1 Pro, M1 Max. Nó giúp cải thiện tốc độ xử lý bằng cách cho phép CPU và GPU truy cập bộ nhớ chung một cách nhanh chóng và hiệu quả hơn.
Vai trò của RAM trong máy tính của bạn
Khi máy tính hoạt động, RAM đóng vai trò quan trọng trong việc lưu trữ dữ liệu tạm thời để CPU và GPU có thể truy cập một cách nhanh chóng và hiệu quả.Khái niệm về RAM trong máy tính truyền thống
RAM trong các thiết bị hiện nay, từ laptop đến desktop, thường được gắn vào bo mạch chủ dưới dạng thanh rời. Trên thanh RAM này chứa hàng loạt chip nhớ DRAM. Dung lượng của RAM chính là tổng dung lượng của các chip này cộng lại.
Một số dòng laptop cao cấp, mỏng nhẹ và hiện đại không sử dụng thanh RAM rời. Thay vào đó, các nhà sản xuất hàn chế chip DRAM trực tiếp lên bo mạch để tăng tốc độ truy xuất, giúp máy trở nên mỏng hơn và giảm số lượng linh kiện. Cách làm này thường xuất hiện trên các dòng MacBook và laptop Ultrabook siêu mỏng nhẹ.
RAM trong máy tính của Apple Silicon
Đối với các máy tính sử dụng chip Apple Silicon như M1, M1 Pro, M1 Max, Apple đã tích hợp chip DRAM này vào cùng một gói với SoC thay vì để nó riêng lẻ bên ngoài bo mạch. Cấu trúc của con chip giống như hình dưới đây, với hai miếng DRAM ở bên phải, và cụm CPU - GPU - NPU và các thành phần khác của SoC ở giữa.
Việc đưa DRAM trực tiếp lên đế chip SoC mang lại lợi ích về tốc độ giao tiếp giữa RAM với CPU / GPU, vượt trội hơn so với việc cách ly (dù là thanh RAM hay RAM hàn trên mainboard truyền thống). Hơn nữa, RAM hiện nay là một 'quỹ chung' có thể được sử dụng và chia sẻ bởi CPU, GPU và tất cả các thành phần khác trong chip.
Để minh họa tầm quan trọng của việc không cần sao chép dữ liệu, chúng ta sẽ lấy ví dụ về trò chơi điện tử, một nhiệm vụ đòi hỏi cả CPU và GPU đều phải hoạt động với hiệu suất cao.
Trong mô hình truyền thống, CPU sẽ nhận các lệnh xử lý cũng như dữ liệu liên quan đến đồ họa và chuyển chúng cho GPU. Điều này dẫn đến việc phải sao chép dữ liệu từ RAM của CPU sang vRAM của GPU. Khi GPU hoàn thành tác vụ, nó phải báo với CPU và dữ liệu lại phải được chuyển về CPU để tiếp tục xử lý, dẫn đến việc sao chép dữ liệu thêm một lần nữa.
UMA loại bỏ bước sao chép dữ liệu này bằng cách cho phép CPU và GPU truy cập vào cùng một vùng nhớ. Khi CPU cần dữ liệu từ GPU, nó chỉ cần thông báo vị trí của dữ liệu. Khi GPU hoàn thành tác vụ, nó cũng chỉ cần thông báo vị trí của kết quả, CPU có thể truy cập trực tiếp. Xong.
RAM trên Apple Silicon không chỉ có kiến trúc mới, mà còn có băng thông cực lớn
Không chỉ có kiến trúc mới, mà RAM trên các con chip M1, M1 Pro, M1 Max cũng là loại có băng thông lớn và độ trễ thấp. Điều này giúp tăng tốc độ truy cập RAM của các thành phần máy tính. Chip M1 có băng thông RAM là 68.25 GB/s, M1 Pro là 200 GB/s và M1 Max là 400 GB/s.
Để so sánh, băng thông RAM tối đa của một con chip Intel Core X-Series chỉ đạt được 94 GB/s, trong khi GPU RTX 3080 Ti của NVIDIA chỉ đạt 912.4 GB/s.
Trên là hình ảnh của con chip Apple M1 Pro. Bạn có thể thấy phần chính của nó lớn hơn, và hai chip RAM cũng lớn hơn và có băng thông cao hơn.
Apple không phải là nhà sản xuất đầu tiên sử dụng UMA
Trước khi Apple ra mắt, NVIDIA đã giới thiệu một giải pháp tương tự gọi là Unified Memory cách đây khoảng 6-7 năm. Unified Memory tạo ra một không gian chung cho CPU và GPU truy cập dữ liệu, giảm thiểu việc sao chép dữ liệu giữa hai bộ xử lý quan trọng này. Tuy nhiên, ở mức phần cứng, giải pháp này thực tế lưu trữ dữ liệu trên các khu vực riêng biệt của bộ nhớ CPU và GPU. Trong khi đó, Apple Silicon không sử dụng không gian địa chỉ ảo mà thực sự sử dụng bộ nhớ vật lý.