Không chỉ sản xuất CPU, các công ty Trung Quốc cũng đang phát triển GPU và Biren Technology là một trong số đó với GPU BR100. Mục tiêu của Biren Technology là nhắm đến thị trường trí tuệ nhân tạo (AI) và tính toán hiệu năng cao (HPC), tương tự như Innosilicon. BR100 được xem là đối thủ đáng gờm cho A100 hay H100 của NVIDIA. GPU chuyên dụng cho AI và HPC của Biren có hai phiên bản: BR100 với hiệu năng tính toán FP32 đạt 256 TFLOPS, INT8 là 2 PetaFLOPS; và BR104 với hiệu năng tính toán FP32 đạt 128 TFLOPS và INT8 đạt 1 PetaFLOPS. Cả hai GPU đều sử dụng bộ nhớ HBM2E, với BR100 được trang bị 64 GB HBM2E, kết nối với bus rộng 4096-bit cho băng thông 1,64 TB/s. BR104 đi kèm với 32 GB HBM2E, băng thông 2048-bit, và băng thông 819 GB/s. Cả hai phiên bản hỗ trợ các định dạng dữ liệu như INT8, FP16, BF16, FP32 và TF32+, nhưng không nhắc đến FP64 - định dạng thường dùng với các ứng dụng siêu tính toán. Ngoài khả năng tính toán, Biren GPU còn hỗ trợ mã hóa và giải mã H.264.

BR100 sẽ được phân phối dưới dạng OAM (OCP Accelerator Module) cho các hệ thống máy chủ, mỗi hệ thống có thể gắn 8 module, các GPU kết nối với nhau qua kết nối Blink 8-way, mức tiêu thụ điện năng tối đa của mỗi module là 550W. BR104 sẽ được bán dưới dạng card PCIe, hỗ trợ đa GPU với tối đa 3 card. Cả hai GPU đều sử dụng giao tiếp PCIe 5.0 x16 với giao thức CXL để kết nối với các bộ gia tốc khác.

Cả hai GPU này đều được sản xuất trên tiến trình 7nm của TSMC, tương tự như tiến trình của NVIDIA A100. Số lượng bóng bán dẫn của BR100 đạt đến 77 tỉ bóng trong khi A100 là 54,2 tỉ bóng. Biren sử dụng thiết kế chipset và công nghệ đóng gói đa chip trên một chất nền CoWoS 2.5D để đạt được số lượng bóng bán dẫn lớn trong khi vẫn giữ được kích thước GPU dưới giới hạn vật lý.
Biren đã hợp tác với Inspur, một nhà cung cấp dịch vụ điện toán đám mây và dữ liệu lớn, để triển khai máy chủ tích hợp 8 hệ thống OAM sử dụng GPU BR100. Baidu và China Mobile sẽ là hai trong số những khách hàng đầu tiên sử dụng GPU của Biren.
Theo: Tom's Hardware
