NVIDIA xác nhận rằng lỗi thiết kế của Blackwell hoàn toàn do họ, không liên quan đến TSMC, và gã khổng lồ Đài Loan đã xử lý vấn đề này.
Theo CEO Jensen Huang, Nvidia đã khắc phục thành công lỗi thiết kế trong chip AI Blackwell mới nhất. Sự cố này đã gây chậm trễ trong sản xuất, nhưng nhờ sự hỗ trợ từ TSMC, vấn đề đã được giải quyết. TSMC là đơn vị đầu tiên phát hiện ra lỗi trong quá trình sản xuất.

Việc sửa lỗi thiết kế này rất quan trọng đối với Nvidia, khi họ muốn giữ vững vị thế hàng đầu trong thị trường chip AI, nơi nhu cầu về giải pháp điện toán hiệu suất cao đang gia tăng. Chip Blackwell dự kiến sẽ là phần cứng chủ lực phục vụ các khách hàng lớn như Meta, Google và Microsoft.
Jensen Huang đã công khai nhận trách nhiệm của Nvidia đối với sự cố này. Ông nói: "Chúng tôi đã gặp phải một lỗi thiết kế với chip Blackwell. Chip vẫn hoạt động, nhưng lỗi này đã làm giảm năng suất sản xuất. Đây hoàn toàn là lỗi của Nvidia."

Chip Blackwell, được giới thiệu vào tháng 3, đã được lên kế hoạch giao hàng trong quý 2 năm nay, nhưng sự cố đã dẫn đến việc trì hoãn. Huang cũng cho biết dự án Blackwell có độ phức tạp cao, với bảy loại chip khác nhau cần được thiết kế và sản xuất đồng thời.
Vấn đề xuất phát từ công nghệ đóng gói phức tạp của các chip GPU Blackwell B100 và B200, áp dụng công nghệ CoWoS-L của TSMC. Vấn đề liên quan đến sự giãn nở nhiệt không đồng đều giữa các thành phần, dẫn đến cong vênh và hỏng hóc hệ thống. Để giải quyết, Nvidia đã điều chỉnh các lớp kim loại và cấu trúc silicon của GPU, cùng với việc sử dụng các mặt nạ mới để nâng cao năng suất sản xuất.

Quá trình giải quyết vấn đề này diễn ra nhanh chóng hơn nhiều so với thông thường. Trong khi những sự cố tương tự trong ngành bán dẫn có thể mất tới ba tháng để khắc phục, Nvidia đã hoàn thành các điều chỉnh với sự hỗ trợ từ TSMC và sẵn sàng bắt đầu sản xuất hàng loạt vào cuối tháng 10. Các lô hàng chip Blackwell đã được sửa lỗi dự kiến sẽ bắt đầu vào đầu năm 2025.
Mặc dù gặp phải thách thức, nhu cầu đối với chip Blackwell vẫn rất cao. Google đã đặt hàng hơn 400.000 chip GB200, trong khi Meta và Microsoft cũng đã ký hợp đồng trị giá hàng tỷ đô la để sử dụng chip Blackwell cho các dự án AI của họ.
