Để đạt được siêu trí tuệ, AI cần nâng cấp công nghệ kết nối và truyền tải dữ liệu trong các cụm siêu máy chủ, nhằm đáp ứng những yêu cầu ngày càng cao về hiệu suất.
Khi các mô hình ngôn ngữ lớn tiến gần tới ngưỡng siêu trí tuệ, công nghệ kết nối dựa trên đồng đã đến giới hạn vật lý về khả năng truyền tải, gây khó khăn lớn trong việc mở rộng kiến trúc các cụm AI hiện đại.
Để giải quyết vấn đề này, sáu ông lớn trong ngành công nghệ – AMD, Broadcom, Meta, Microsoft, NVIDIA và OpenAI – đã chính thức thành lập liên minh Optical Compute Interconnect Multi-Source Agreement (OCI MSA), mở ra một bước ngoặt quan trọng cho sự phát triển hệ sinh thái quang học mở rộng.

Thông số kỹ thuật của OCI, đã được công khai tại www.oci-msa.org, được tối ưu hóa về công suất, độ trễ và chi phí. Công nghệ này sử dụng điều chế non-return to zero kết hợp với công nghệ quang học ghép kênh phân chia bước sóng, đồng thời chuyển đổi mô hình kết nối từ module sang silicon.
Với khả năng tích hợp sâu hơn giữa công nghệ quang học và silicon tính toán, OCI mở ra cơ hội phát triển lớn về mật độ băng thông và khả năng mở rộng hệ thống, đồng thời vẫn giữ được hiệu quả công suất cao của kết nối đồng truyền thống.
Thông qua việc thiết lập giao thức quang học tương thích, OCI MSA tạo ra một hệ sinh thái "plug-and-play" thực thụ. Với thông số kỹ thuật mở và khả năng tương tác, các hyperscaler có thể kết nối các bộ xử lý XPU và các switch mở rộng với một lớp vật lý quang học chung, giúp kết hợp tối ưu công nghệ tính toán và quang học tiên tiến.
Lộ trình chuẩn hóa này giúp giảm thiểu rủi ro trong quá trình tích hợp, rút ngắn thời gian phát triển và mang lại một hướng đi rõ ràng cho toàn bộ chuỗi cung ứng rack AI, từ đó giảm thiểu các rủi ro liên quan đến triển khai kết nối quang học đa thế hệ và từ nhiều nhà cung cấp.

OCI MSA cung cấp một lộ trình thông số kỹ thuật mở, có thể mở rộng, cho toàn bộ chuỗi cung ứng rack AI. Phiên bản OCI GEN1 áp dụng công nghệ 4 bước sóng nhân 50Gbps NRZ, đạt tốc độ 200Gbps mỗi hướng, trong khi OCI GEN2 sử dụng công nghệ hai chiều với tốc độ lên đến 400Gbps mỗi hướng, tương đương 800Gbps mỗi sợi quang.
Tuy nhiên, đây chỉ là bước đầu tiên trong lộ trình dài hạn, với mục tiêu mở rộng số lượng bước sóng và tốc độ dữ liệu lên đến 3,2Tbps mỗi sợi, và có thể còn cao hơn nữa. Điều này sẽ giúp các miền mở rộng được thực hiện với số lượng GPU cao hơn và băng thông trên mỗi GPU cũng sẽ tăng.
Các lãnh đạo cấp cao của sáu công ty sáng lập đều nhấn mạnh tầm quan trọng chiến lược của liên minh này. Brian Amick, Phó Chủ tịch cấp cao phụ trách Công nghệ và Kỹ thuật tại AMD, khẳng định nhu cầu đối với kết nối quang học mở rộng để hỗ trợ các hệ thống AI lớn trong thập kỷ này là vô cùng cấp thiết.

Gilad Shainer, Phó Chủ tịch cấp cao phụ trách Mạng tại NVIDIA, tuyên bố OCI MSA sẽ cung cấp quy mô và hiệu suất cần thiết cho kỷ nguyên siêu trí tuệ tiếp theo, mang lại khả năng tính toán tối ưu kết hợp với công nghệ quang học tiên tiến.
Đặc biệt, Richard Ho, Trưởng bộ phận Phần cứng tại OpenAI, nhấn mạnh rằng việc cải thiện trí tuệ nhân tạo không ngừng đòi hỏi mở rộng các siêu máy tính AI, với nhiều petaflops hơn, băng thông bộ nhớ cao hơn và quan trọng nhất là băng thông mạng lớn hơn trên các miền rộng lớn hơn, đòi hỏi phạm vi truyền tải xa hơn.
Ông khẳng định rằng OCI MSA sẽ đóng vai trò quan trọng trong việc xây dựng các hệ thống AI giúp đạt được AGI, trí tuệ nhân tạo tổng quát. Việc sáu công ty hàng đầu thế giới thống nhất một tiêu chuẩn mở thay vì cạnh tranh với các giải pháp độc quyền cho thấy họ đều nhận thức được rằng thách thức về hạ tầng AI hiện tại đã vượt quá khả năng giải quyết của bất kỳ công ty đơn lẻ nào.
