Thị trường AI đang chứng kiến một nghịch lý: giá token ngày càng rẻ nhưng hóa đơn cuối tháng lại phình to, buộc nhiều doanh nghiệp nhận ra rằng thuê nhân lực đôi khi vẫn kinh tế hơn vận hành máy móc.

Trong vài năm trở lại đây, các tập đoàn công nghệ hàng đầu thế giới đã rót hàng tỷ USD vào cuộc đua trí tuệ nhân tạo. Bức tranh được vẽ ra đầy lạc quan, rằng AI sẽ thay thế hoặc hỗ trợ tối đa con người, giúp doanh nghiệp cắt giảm chi phí vận hành và tăng mạnh hiệu suất.
Tuy nhiên, khi ánh hào quang ban đầu của cơn sốt Generative AI dần hạ nhiệt, một thực tế khó chịu bắt đầu xuất hiện. Theo The Verge và The Information, việc yêu cầu nhân sự tận dụng AI ở mức tối đa đang tạo ra những hóa đơn khổng lồ, khiến nhiều “ông lớn” buộc phải vội vàng điều chỉnh chiến lược.
“Cháy túi” chỉ sau 4 tháng
Microsoft – một trong những trụ cột thúc đẩy làn sóng AI hiện nay – vừa đưa ra một quyết định gây bất ngờ. Theo The Verge, tập đoàn này đã bắt đầu hủy phần lớn giấy phép sử dụng công cụ Claude Code của Anthropic cho các kỹ sư nội bộ. Thay vào đó, họ chuyển sang GitHub Copilot CLI, một giải pháp do chính mình phát triển.
Quyết định này được đưa ra chỉ khoảng 60 ngày sau khi Microsoft mở rộng quyền truy cập Claude Code cho hàng nghìn lập trình viên, quản lý dự án và nhà thiết kế nhằm thử nghiệm và hỗ trợ lập trình.

Công cụ này nhanh chóng trở thành hiện tượng nội bộ của Microsoft, nhưng cũng chính vì thế mà vấn đề phát sinh. Lượng sử dụng tăng đột biến trên quy mô lớn đã khiến chi phí vận hành đội lên mức khó tin, buộc ban lãnh đạo phải đảo ngược quyết định với một công cụ mà các kỹ sư vừa bắt đầu phụ thuộc mạnh mẽ.
Cần lưu ý rằng việc Microsoft hủy giấy phép Claude Code nội bộ không làm ảnh hưởng đến thỏa thuận hợp tác Foundry trị giá 5 tỷ USD với Anthropic, vốn cho phép khách hàng Microsoft truy cập mô hình Claude, cũng như cam kết mua 30 tỷ USD năng lực tính toán Azure từ phía Anthropic.
Dù vậy, sự việc này cho thấy ngay cả Microsoft – một ông lớn sở hữu hạ tầng điện toán đám mây hàng đầu thế giới – cũng đang phải “toát mồ hôi” trước chi phí AI phát sinh từ chính đội ngũ nội bộ của mình.
Microsoft không phải trường hợp duy nhất trong bài toán kiểm soát chi phí này. Uber còn rơi vào tình huống trớ trêu hơn khi Giám đốc Công nghệ (CTO) Praveen Neppalli Naga chia sẻ với The Information rằng công ty đã tiêu hết ngân sách công cụ lập trình AI của cả năm 2026 chỉ sau 4 tháng đầu năm.
Nguyên nhân bắt nguồn từ việc Uber từng tích cực khuyến khích nhân viên dùng AI, thậm chí xây dựng bảng xếp hạng nội bộ vinh danh những nhóm có mức độ sử dụng công cụ AI cao nhất. Chính sự thúc đẩy quá mức này đã biến thành cơn khủng hoảng chi phí ngoài tầm kiểm soát.
Những báo cáo tài chính nội bộ này như một cú tạt nước lạnh vào tham vọng của giới đầu tư tại Thung lũng Silicon. Trong khi các CEO vẫn nhấn mạnh “cuộc cách mạng năng suất”, thì rào cản chi phí lại cho thấy đây là nút thắt khó gỡ, chứng minh việc thay thế hay bổ trợ lao động bằng AI phức tạp hơn nhiều so với dự đoán ban đầu.
Đây cũng là quan điểm được ông Bryan Catanzaro – Phó Chủ tịch mảng Học sâu Ứng dụng tại Nvidia – đề cập. Trong một cuộc phỏng vấn với Axios, ông thẳng thắn cho biết rằng với đội ngũ của mình, chi phí tính toán phần cứng hiện còn vượt xa chi phí trả lương cho nhân sự.

Nhận định từ một lãnh đạo cấp cao của Nvidia – công ty đang chi phối thị trường chip AI toàn cầu – đã phơi bày một thực tế: vận hành và duy trì hệ thống AI để thay thế con người hiện nay vẫn tốn kém hơn đáng kể so với việc tuyển dụng các kỹ sư giỏi bằng xương bằng thịt.
Nghịch lý AI: Token càng rẻ, hóa đơn cuối tháng càng phình to
Không chỉ Uber hay Microsoft, xu hướng thúc ép nhân viên khai thác AI tối đa đang âm thầm lan rộng. Tại Meta, một nhân viên thậm chí tạo ra bảng xếp hạng mang tên "Claudeonomics" để theo dõi ai đang tiêu tốn nhiều tài nguyên AI nhất.
Amazon – gã khổng lồ thương mại điện tử – cũng không đứng ngoài cuộc khi liên tục khuyến khích nhân viên tham gia “tokenmaxx”, tức tối đa hóa mức tiêu thụ token AI trong công việc hằng ngày.
Tuy nhiên, với mô hình tính phí dựa trên số lượng token, việc nhân viên làm việc càng hiệu quả lại kéo theo hệ quả trái ngược: hóa đơn chi trả cho các nhà cung cấp AI ngày càng tăng mạnh.
Goldman Sachs gần đây dự báo rằng việc triển khai các tác tử AI (AI agents) có thể khiến mức tiêu thụ token toàn cầu tăng gấp 24 lần vào năm 2030, chạm mốc khoảng 120 triệu tỷ token mỗi tháng.
Khi doanh nghiệp chuyển từ chatbot phản hồi đơn thuần sang các tác tử AI tự vận hành để tối ưu công việc, tổng chi phí vận hành sẽ tăng vọt, dù đơn giá mỗi token có thể tiếp tục giảm.
Cùng quan điểm, một báo cáo từ công ty phân tích thị trường Gartner cho biết đến năm 2030, chi phí xử lý (inference) cho một mô hình ngôn ngữ lớn quy mô nghìn tỷ tham số có thể giảm gần 90% so với năm 2025. Tuy nhiên, Gartner cũng cảnh báo rằng giá token giảm không đồng nghĩa với việc doanh nghiệp sẽ tiết kiệm chi phí.
Nguyên nhân là các mô hình tác tử tự trị tiêu tốn lượng token khổng lồ cho mỗi nhiệm vụ so với mô hình truyền thống. Tốc độ tăng tiêu thụ có thể vượt xa tốc độ giảm giá đơn vị tính toán. Đồng thời, các nhà cung cấp dịch vụ AI khó có khả năng chuyển toàn bộ lợi ích chi phí sang khách hàng doanh nghiệp, khiến chi phí suy luận thực tế vẫn tiếp tục tăng.
Ông Will Sommer, Giám đốc Phân tích cấp cao tại Gartner, đã đưa ra cảnh báo mạnh mẽ rằng các Giám đốc Sản phẩm không nên đánh đồng việc token thương mại giảm giá với sự phổ cập của năng lực lập luận cao cấp trong AI.

Thực tế tài chính khắc nghiệt này chắc chắn sẽ làm xáo trộn nhiều kế hoạch vĩ mô của các doanh nghiệp đang kỳ vọng triển khai trợ lý AI trên diện rộng. CEO Nvidia, ông Jensen Huang, gần đây từng chia sẻ tầm nhìn rằng tương lai có thể có khoảng 100 tác tử AI hỗ trợ song song cho mỗi nhân viên trong công ty.
Tầm nhìn của lãnh đạo Nvidia phản ánh làn sóng các nhà điều hành đang hình dung một lực lượng lao động số hóa có thể vận hành trơn tru mọi hoạt động trong doanh nghiệp.
Tuy nhiên, nếu tốc độ tiêu thụ token của các mô hình này tiếp tục vượt xa tốc độ giảm giá phần cứng, kỷ nguyên tác tử AI tự trị có thể kéo theo những hóa đơn vận hành khổng lồ nằm ngoài mọi dự tính của ban lãnh đạo doanh nghiệp.
Suy cho cùng, công nghệ chỉ tạo ra cuộc cách mạng thực sự khi nó giải quyết được bài toán chi phí. Nếu việc dùng AI thay thế con người vẫn giữ mức giá “xa xỉ” như hiện nay, thì trong nhiều năm tới, con người vẫn có thể là lựa chọn kinh tế hơn đối với doanh nghiệp.
*Nguồn tham khảo: The Verge, The Information, Fortune
