Một Startup khẳng định sẽ phát triển chip AI có hiệu suất vượt trội gấp 20 lần so với H100 của Nvidia.
Tại Tọa đàm 'Thiết kế chip bán dẫn: Cơ hội mới - Tương lai' diễn ra vào 13/4/2024, ông Harsh Bharwani - CEO Tập đoàn Jetking (hơn 75 năm hoạt động trong lĩnh vực giáo dục và đào tạo công nghệ) - cho biết, hiện nay giá trị ngành chip trên toàn cầu là 500 tỷ USD, nhưng trong thời gian tới dự kiến sẽ tăng lên gần gấp 4 lần đạt 1.800 tỷ USD.
Mới đây, startup Etched có trụ sở tại San Francisco gây bất ngờ trong làng công nghệ khi tuyên bố chiếc chip AI mới của họ mang tên Sohu, với khả năng xử lý mạnh mẽ vượt trội gấp 20 lần GPU H100 nổi tiếng của Nvidia.
Sohu là một loại mạch tích hợp ứng dụng đặc biệt (ASIC) được thiết kế tối ưu cho mô hình ngôn ngữ lớn (LLM). Theo Etched, Sohu thể hiện khả năng suy luận vượt trội hơn H100 trong các nhiệm vụ liên quan đến LLM. Thậm chí, hệ thống 8 chip Sohu có thể đạt hiệu suất tương đương 160 GPU H100 kết hợp.
Startup Etched chỉ ra rằng các hệ thống tăng tốc AI hiện nay, bao gồm cả CPU và GPU, được thiết kế để tương thích với nhiều kiến trúc AI khác nhau, từ Mạng thần kinh tích chập (CNN), Mạng bộ nhớ ngắn hạn (LSTM) đến mô hình không gian trạng thái. Do đó, cần phải phân bổ một lượng lớn tài nguyên tính toán cho khả năng lập trình, dẫn đến lãng phí hiệu suất đáng kể.
Theo ước tính của Etched, GPU H100 của Nvidia chỉ sử dụng 3,3% số lượng bóng bán dẫn cho tác vụ chính, trong khi 96,7% còn lại dành cho các tác vụ phụ trợ. Điều này khá lãng phí dù là vấn đề này khó tránh khỏi đối với các chip AI đa năng.
Etched đã giải quyết vấn đề này bằng cách tích hợp kiến trúc AI biến áp (Transformer) vào Sohu, cho phép tối ưu hóa phân phối bán dẫn cho các nhiệm vụ tính toán AI. Thay vì tạo ra một con chip 'đa năng' không hiệu quả, Etched tập trung vào việc tối ưu hóa Sohu cho mô hình AI cụ thể là Transformer, nền tảng của nhiều mô hình ngôn ngữ lớn như GPT, Sora, Gemini, Stable Diffusion và Dall-E.
Giám đốc điều hành của Etched, Gavin Uberti cho biết, 'quyết định táo bạo khi đặt cược vào kiến trúc Transformer, nếu Transformer thất bại, công ty sẽ sụp đổ, nhưng nếu nó tiếp tục phát triển, công ty có tiềm năng trở thành một trong những tên tuổi lớn nhất thế giới'.
Trước đó, Etched đã thông báo về việc huy động được 120 triệu USD trong vòng gọi vốn series-A. Số tiền này sẽ được sử dụng để phát triển sâu hơn chip xử lý chuyên dụng của công ty. Etched đang phát triển một bộ xử lý chuyên dụng để vận hành mô hình AI tương tự như của OpenAI và Gemini của Google đang được sử dụng rộng rãi hiện nay.
Các kỹ sư của công ty đang phát triển chip để thực hiện chức năng tạo nội dung và phản hồi của hệ thống AI. Đây là con chip đầu tiên do Etched thiết kế, sẽ được tối ưu hóa để chạy mô hình AI transformer.