Cuộc đua giành lợi nhuận từ trí tuệ nhân tạo giữa Google và Microsoft đang diễn ra gay gắt

Buzz

Ngày cập nhật gần nhất: 15/4/2026

Nội dung bài viết

Google giới thiệu API PaLM cho mô hình ngôn ngữ

Xem thêm

Đọc tóm tắt

- Mô hình ngôn ngữ GPT-4 ra mắt, thay đổi cách con người tương tác với máy móc và máy tính phục vụ con người.
- Cuộc đua nghiên cứu và phát triển trí tuệ nhân tạo giữa Microsoft và Google đang diễn ra gay gắt.
- Google giới thiệu API PaLM cho mô hình ngôn ngữ PaLM, tùy chỉnh mô hình cho nhiều tác vụ khác nhau.
- Microsoft đầu tư mạnh mẽ, sử dụng GPU Nvidia H100 mạnh mẽ cho xử lý trí tuệ nhân tạo trên nền tảng Azure.
- Microsoft nâng cấp hệ thống máy tính đào tạo thuật toán trí tuệ nhân tạo ChatGPT trên Azure, sử dụng GPU H100 Tensor Core.
- Các máy chủ Azure trang bị GPU H100, NVSwitch, NVLink 4.0, CPU Intel Xeon Scalable, RAM DDR5 4800MHz 16 Channel.
- Sức mạnh tính toán cần được nâng cao để đáp ứng yêu cầu ngày càng tăng của các mô hình ngôn ngữ và thuật toán học máy.

Mô hình ngôn ngữ GPT-4 vừa ra mắt chính thức, hứa hẹn thay đổi cách con người tương tác với máy móc và cách máy tính phục vụ con người. Trong khi đó, cuộc đua nghiên cứu và phát triển sản phẩm trí tuệ nhân tạo giữa hai tên lớn Microsoft và Google cũng đang diễn ra gay gắt, với các thông tin chính thức được công bố. Tuy nhiên, đối với phần lớn người dùng các dịch vụ trực tuyến, những thuật ngữ và thông tin này thường gây khó hiểu và không hấp dẫn.

Thiếu đi những thuật ngữ và thông tin như vậy, việc mô tả cách những thuật toán máy học hoạt động và phục vụ hàng tỷ người sẽ trở nên vô cùng khó khăn.

Google giới thiệu API PaLM cho mô hình ngôn ngữ

PaLM, một mô hình ngôn ngữ mới, tương tự như LLaMa của Meta và GPT của OpenAI. Google vừa thông báo ra mắt API cho mô hình này, kết hợp với các công cụ phục vụ doanh nghiệp.

Với PaLM, các doanh nghiệp có thể tùy chỉnh mô hình để thực hiện nhiều tác vụ khác nhau. Từ việc biến mô hình thành chatbot hỗ trợ khách hàng, biến nó thành công cụ tổng hợp thông tin trong môi trường doanh nghiệp, ví dụ như tổng hợp ý chính trong các cuộc họp trực tuyến, thậm chí là viết code, Google khẳng định PaLM có thể làm tất cả.

Microsoft đầu tư mạnh mẽ, sử dụng GPU Nvidia H100 mạnh mẽ cho xử lý trí tuệ nhân tạo Trên trang blog chính thức của Microsoft, hãng vừa tiết lộ chi tiết kỹ thuật của hệ thống máy tính đào tạo thuật toán trí tuệ nhân tạo, để công bố việc nâng cấp toàn diện dàn máy chủ vận hành trí tuệ nhân tạo ChatGPT trên nền tảng đám mây Azure. Trước đó, cụm máy chủ Azure xử lý trí tuệ nhân tạo của Microsoft đã được trang bị cụm máy chủ thế hệ trước, ND A100 v4, với các GPU Nvidia A100 Tensor Core theo kiến trúc Ampere, được tối ưu hóa để gia tăng hiệu suất xử lý các thuật toán học máy. Microsoft đã trang bị hàng nghìn GPU như vậy cho hạ tầng của mình, tạo điều kiện cho việc sử dụng sức mạnh tính toán của các mô hình ngôn ngữ cũng như các thuật toán trí tuệ nhân tạo của OpenAI và các đối tác doanh nghiệp khác mong muốn tận dụng sức mạnh tính toán của các mô hình ngôn ngữ và thuật toán trí tuệ nhân tạo.

Scott Guthrie, phó chủ tịch phụ trách AI và điện toán đám mây của Microsoft, thông báo rằng họ đã đầu tư hàng trăm triệu USD để nâng cấp hệ thống. Hiện nay, máy chủ Azure phục vụ xử lý trí tuệ nhân tạo được trang bị cả GPU A100 thế hệ trước và GPU H100 Tensor Core, kiến trúc Hopper mới nhất của Nvidia, được giới thiệu vào năm ngoái.

Các đối tác của Microsoft thuê máy chủ Azure xử lý trí tuệ nhân tạo sẽ trải nghiệm hệ thống có khả năng mở rộng cực kỳ mạnh mẽ, với sức mạnh từ 8 đến hàng nghìn GPU tuỳ thuộc vào nhu cầu và ngân sách của họ. Bên trong mỗi máy ảo NC H100 v5 VM, có các thông số kỹ thuật như sau:

8 GPU Nvidia H100 Tensor Core, được kết nối thông qua cầu nối NVSwitch và NVLink 4.0
Cầu nối dữ liệu Nvidia Quantum-2 CX7 InfiniBand với băng thông 400 Gb/s, mỗi máy ảo có tốc độ xử lý dữ liệu lên đến 3.2 Tb/s.
Cầu nối NVSwitch và NVLink 4.0 tạo ra băng thông dữ liệu lên đến 3.6 TB/s trong toàn bộ cụm 8 GPU H100.
4 CPU Intel Xeon Scalable.
Kết nối PCIe Gen 5, với băng thông của mỗi GPU đạt ngưỡng 64GB/s.
RAM DDR5 4800MHz 16 Channel.

Đọc qua cấu hình của từng cụm máy chủ, ta có thể thấy rõ rằng, với sự phát triển không ngừng của các mô hình ngôn ngữ và thuật toán học máy, số lượng tham số cần thiết để tạo ra nội dung chân thực và đáp ứng yêu cầu ngày càng tăng. Do đó, sức mạnh tính toán cũng phải được nâng cao theo cấp số nhân. Điều này dẫn đến việc cả chi phí mua sắm và vận hành các thiết bị sẽ tăng lên trong tương lai. Thương mại hóa các hệ thống máy chủ này cho các đối tác doanh nghiệp là lựa chọn hợp lý nhất.

Đọc thêm:

Các câu hỏi thường gặp

Mô hình ngôn ngữ GPT-4 có gì đặc biệt?

GPT-4 là mô hình ngôn ngữ tiên tiến, giúp cải thiện khả năng tương tác giữa người và máy tính, cung cấp các dịch vụ tự động và hỗ trợ người dùng thông minh hơn.

Google PaLM có thể làm gì cho doanh nghiệp?

Google PaLM có thể tùy chỉnh cho nhiều ứng dụng, từ chatbot hỗ trợ khách hàng đến tổng hợp thông tin trong môi trường doanh nghiệp, thậm chí hỗ trợ viết mã.

Microsoft sử dụng GPU gì cho AI trên Azure?

Microsoft sử dụng GPU Nvidia H100 Tensor Core mới nhất cho xử lý trí tuệ nhân tạo trên nền tảng Azure, nâng cao hiệu suất và khả năng mở rộng hệ thống AI.

GPU Nvidia H100 có điểm gì nổi bật?

GPU Nvidia H100 với kiến trúc Hopper và kết nối NVLink 4.0 cung cấp băng thông dữ liệu cực kỳ cao, lên đến 3.6 TB/s, hỗ trợ xử lý AI nhanh chóng và hiệu quả.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]