Mỗi GPU có giá lên đến hàng chục nghìn USD, chưa kể chi phí năng lượng và hệ thống làm mát khổng lồ, tổng chi phí cho Colossus có thể lên đến hàng tỷ USD
Elon Musk và công ty AI của ông, xAI, đang lên kế hoạch nâng cấp siêu máy tính Colossus lên hơn 1 triệu GPU, theo báo cáo từ Financial Times. Khi hoàn tất, Colossus sẽ trở thành một trong những siêu máy tính mạnh mẽ nhất thế giới. Tuy nhiên, để đạt được mục tiêu này, xAI sẽ phải vượt qua những thách thức về tài chính, nguồn cung cấp GPU và cơ sở hạ tầng kỹ thuật.
Mục tiêu đột phá với Colossus
Hiện nay, Colossus đang sử dụng hơn 100.000 GPU Nvidia H100, một trong những dòng vi xử lý mạnh nhất cho AI. xAI dự định tăng gấp đôi số GPU này để biến Colossus thành siêu máy tính lớn nhất thế giới, được đặt trong một tòa nhà duy nhất.
Để đạt được tham vọng này, xAI đã hợp tác với những đối tác lớn như Nvidia, Dell và Supermicro. Tại Memphis, Tennessee, nơi đặt trụ sở Colossus, xAI đã thành lập một đội ngũ chuyên trách để hỗ trợ vận hành và mở rộng dự án. Thành phố Memphis cũng đang cung cấp các nguồn lực và cơ sở hạ tầng cần thiết để bảo đảm tiến độ.

Một câu hỏi quan trọng là xAI sẽ chọn sử dụng GPU Hopper hiện tại hay chờ đợi thế hệ Blackwell mới. Blackwell được kỳ vọng có hiệu suất vượt trội và khả năng mở rộng tốt hơn, giúp tối ưu quá trình đồng bộ hóa 1 triệu GPU. Tuy nhiên, với nhu cầu GPU Nvidia cao ngất ngưởng, việc sở hữu từ 800.000 đến 900.000 GPU là một thách thức lớn, ngay cả đối với xAI.
Chi phí đầu tư cho Colossus là một thách thức lớn. Mỗi GPU có giá trị hàng chục nghìn USD, cộng thêm chi phí năng lượng và làm mát rất cao, khiến tổng chi phí cho dự án có thể lên tới hàng chục tỷ USD. Tuy nhiên, xAI đã huy động thành công 11 tỷ USD trong năm nay và tiếp tục thu thêm 5 tỷ USD, nâng giá trị công ty lên 45 tỷ USD.
Chiến lược độc lập đầy tham vọng
Khác với OpenAI hợp tác với Microsoft hay Anthropic làm việc cùng Amazon, xAI tự phát triển toàn bộ khả năng siêu máy tính của mình. Điều này giúp công ty giữ vững quyền chủ động và đi đầu trong cuộc đua công nghệ, mặc dù cũng đối mặt với nhiều rủi ro.
Dự án cũng nhận phải một số chỉ trích, trong đó có việc vi phạm các quy định quy hoạch và tạo gánh nặng cho hệ thống điện địa phương. Để giải quyết vấn đề này, xAI đã triển khai các giải pháp ổn định mạng lưới điện, bao gồm việc sử dụng công nghệ Tesla Megapack để quản lý nhu cầu năng lượng khổng lồ.
Mặc dù Colossus được đánh giá rất cao về công nghệ, sản phẩm thương mại của xAI như mô hình ngôn ngữ Grok hiện vẫn chưa thể so sánh với các đối thủ như hay Google Gemini. Grok còn hạn chế cả về độ phức tạp và số lượng người dùng.
Tuy vậy, các nhà đầu tư tin rằng Colossus là bước đi nền tảng, minh chứng cho khả năng triển khai công nghệ tiên tiến của xAI. Với sức mạnh phần cứng vượt trội, Colossus có tiềm năng giúp xAI trở thành một nhân tố quan trọng thay đổi cục diện ngành AI trong tương lai.
