
Với Mỹ áp đặt các biện pháp cấm vận về chip bán dẫn để kiềm chế sự phát triển của ngành công nghệ Trung Quốc, Nvidia mới đây đã giới thiệu phiên bản GPU xử lý Trí tuệ Nhân tạo mang tên A800. Sử dụng kiến trúc Ampere, A800 giảm băng thông cầu nối NVLink giữa các GPU từ 600 GB/s trên A100 xuống còn 400 GB/s trên A800 để kiểm soát công suất và tốc độ xử lý dữ liệu cho thuật toán máy học. Do giảm băng thông bộ nhớ, sức mạnh của hệ thống máy chủ trang bị A800 đạt khoảng 70% so với A100.
Điều này tất nhiên không ngăn cản được các đại gia công nghệ như Baidu, ByteDance, Tencent và Alibaba chi hàng tỷ USD để mua A800 để đáp ứng nhu cầu nghiên cứu Trí tuệ Nhân tạo. Theo nguồn tin của Financial Times, trong năm 2023, đơn đặt hàng A800 từ các tập đoàn công nghệ hàng đầu Trung Quốc tại Nvidia đã đạt mức 1 tỷ USD, tương đương với 100 nghìn chiếc.
Đến năm 2024, theo những nguồn tin đáng tin cậy từ FT, đơn đặt hàng A800 của các tập đoàn Trung Quốc tới Nvidia được ước tính có giá trị lên đến 4 tỷ USD.
Tencent và ByteDance đang đua nhau đặt hàng lượng lớn chip xử lý trí tuệ nhân tạo, và có một nguyên nhân được dự đoán cho hành động này. Có thể họ đang lo lắng rằng trong tương lai gần, chính quyền Tổng thống Biden sẽ tiếp tục thực hiện các biện pháp hạn chế và cấm vận, giới hạn khả năng xuất khẩu của các con chip bán dẫn Mỹ sang Trung Quốc. Hiện tại, A800 được coi là một trong những GPU xử lý trí tuệ nhân tạo mạnh mẽ nhất mà Trung Quốc có thể mua theo hình thức chính thức.
Ngược lại, từng có thông tin cho rằng ở Thâm Quyến, có chợ đen chuyên bán GPU, nơi mà Nvidia A100 được bán với giá gấp đôi hoặc gấp ba so với giá chính hãng, lên đến 10 nghìn USD. Thậm chí có một cuộc điều tra của Reuters về chủ đề này.
Trong buổi thứ Tư của tuần này, chính phủ Mỹ đã đưa ra một quyết định cấm mới có hiệu lực từ năm 2024, đặt hạn chế đầu tư của các công ty Mỹ vào các tổ chức nghiên cứu về máy tính lượng tử, chip công nghệ cao và trí tuệ nhân tạo tại Trung Quốc.
Một nhân viên Baidu, người đã yêu cầu giấu tên, chia sẻ rằng: “Nếu không có chip của Nvidia, chúng tôi sẽ không thể huấn luyện các mô hình ngôn ngữ quy mô lớn.” Đối với ByteDance, chủ sở hữu của DouYin và TikTok, họ đang nghiên cứu một chatbot AI mang tên mã Grace. TikTok đã thử nghiệm một dịch vụ chatbot khác vào đầu năm, được gọi là TikTok Tako, với thuật toán dựa trên mô hình mua bản quyền của OpenAI thay vì phát triển tự do.
Nguồn tin từ ByteDance cho biết, tập đoàn này đã tích trữ ít nhất 10 nghìn GPU Nvidia để hỗ trợ dự án nghiên cứu về giải pháp trí tuệ nhân tạo cho mạng xã hội. Dự kiến vào năm 2024, ByteDance sẽ chi khoảng 700 triệu USD để mua 70 nghìn card A800. Trong khi đó, Alibaba đang lên kế hoạch tích hợp trí tuệ nhân tạo vào tất cả các sản phẩm và dịch vụ công nghệ của họ, bao gồm cả nền tảng thương mại điện tử Taobao và ứng dụng bản đồ Gaode Map. Baidu cũng đang phát triển một chatbot AI với tên gọi Ernie Bot.
Từ đầu năm và đặc biệt là kể từ khi ChatGPT chính thức xuất hiện vào những tuần cuối năm 2022, đám đông hứng khởi và sự phát sốt về trí tuệ nhân tạo đã lan tỏa khắp thị trường công nghệ Trung Quốc. Điều này thúc đẩy cuộc đua nghiên cứu công nghệ AI, và đồng thời kéo theo đầu tư mạnh mẽ vào việc mua sắm GPU dành cho nghiên cứu trí tuệ nhân tạo. Với nhu cầu tăng cao, giá của những GPU như A800 cũng tăng vọt. Một đại lý phân phối chính thức GPU của Nvidia cho biết, giá của GPU A800 đã tăng hơn 50% chỉ trong nửa năm qua.
Trong tháng 4 vừa qua, Tencent Cloud đã giới thiệu dịch vụ máy chủ mới trang bị Nvidia H800, một phiên bản GPU mới nhất được tối ưu hóa cho xử lý ma trận và tensor, trở thành trái tim của mọi thuật toán trí tuệ nhân tạo. H800 cũng được thiết kế với băng thông bộ nhớ kết nối NVLink giới hạn để đảm bảo hiệu suất xử lý thấp hơn so với H100, nhưng vẫn đủ để được xuất khẩu sang Trung Quốc. Ngay cả Alibaba Cloud cũng đã đặt hàng hàng nghìn chip H800 từ Nvidia.
Theo Financial Times