Các gã khổng lồ như Google, Microsoft và OpenAI đều đang tiến vào cuộc cách mạng mang tên "tác nhân AI".
Kỷ nguyên AI đã bắt đầu, và những công ty công nghệ hàng đầu đang tập trung nguồn lực để phát triển thứ được xem là "phát minh cuối cùng của nhân loại". Có hai lý do khiến AI được gọi như vậy: một là nó sẽ thay con người tiếp tục sáng tạo, hoặc hai là nó sẽ chấm dứt sự tồn tại của chúng ta.
Tuy nhiên, bài viết này không tập trung vào những viễn cảnh xa vời mang màu sắc khoa học viễn tưởng. Thay vào đó, chúng ta sẽ khám phá bước tiến hóa tiếp theo của AI, thứ đang dần hiện rõ hình hài: tác nhân AI - AI agent.


Hầu hết các mô hình AI chúng ta đang sử dụng, như của OpenAI, Gemini của Google hay DeepSeek của High-Flyer, đều là chatbot có khả năng trả lời câu hỏi. Nhưng ở cấp độ cao hơn, tác nhân AI có thể trực tiếp thực hiện công việc thay bạn.
Các tập đoàn công nghệ hàng đầu thế giới, bao gồm Google, Microsoft, OpenAI và Salesforce, đều đã công bố kế hoạch phát triển tác nhân AI. Họ tin rằng bước tiến hóa này sẽ mang lại hiệu suất vượt trội cho các hệ thống hỗ trợ ngành y tế, chăm sóc sức khỏe, nghiên cứu robot, tài chính ngân hàng, và nhiều lĩnh vực sản xuất, kinh doanh khác.
Tác nhân AI cấp thấp có thể thực hiện các nhiệm vụ đơn giản như trả lời câu hỏi hoặc gửi email thay con người. Trong khi đó, tác nhân AI tiên tiến hơn có thể tự động đặt phòng khách sạn, tìm kiếm thông tin trên web hoặc lên kế hoạch hàng ngày cho bạn.
Trong video giới thiệu mới được đăng tải, Google đã thể hiện cách tác nhân AI của họ, Gemini, có thể cải thiện chất lượng cuộc sống của người dùng. Bạn có thể nhấn vào nút "CC" và chọn tiếng Việt để xem phụ đề.
Nói một cách khác, bạn chính là một ví dụ sống động của khái niệm "tác nhân". Bạn có thể đưa ra quyết định và hành động dựa trên tình huống và thông tin thu thập được từ các giác quan; bạn là tác nhân của chính mình.
Giáo sư Brian O'Neill, một chuyên gia khoa học máy tính, giải thích trên TechSpot rằng tác nhân AI là một công cụ công nghệ có khả năng học hỏi từ môi trường xung quanh và thông qua lời nhắc của con người, chúng giải quyết vấn đề hoặc thực hiện các nhiệm vụ cụ thể trong môi trường đó.
Nội dung dưới đây được Giáo sư O'Neill chia sẻ, cho thấy cách tác nhân AI có thể thay đổi thế giới.

Một hệ thống tự động điều chỉnh nhiệt độ phòng là một tác nhân cấp thấp. Khả năng cảm nhận của nó khá hạn chế, chỉ đo được nhiệt độ phòng. Khi nhiệt độ thấp hơn mức tiêu chuẩn, nó sẽ phản ứng bằng cách tăng nhiệt lên.
Phiên bản nâng cao hơn, một robot hút bụi, có thêm nhiều tính năng. Nó có thể học cách nhận biết khu vực cần làm sạch, sử dụng cảm biến để phát hiện bụi bẩn và phản ứng bằng cách dọn dẹp.

Các nhà nghiên cứu AI gọi hệ thống điều chỉnh nhiệt độ là một tác nhân phản xạ đơn giản. Nó có thể đưa ra quyết định, nhưng những quyết định này đơn giản và dựa trên thông tin nhận được trong thời gian thực.
Robot hút bụi là một tác nhân có mục tiêu cụ thể, chỉ tập trung vào việc dọn dẹp những khu vực được chỉ định. Những quyết định mà robot tự động đưa ra, chẳng hạn như điều chỉnh lực hút hoặc chọn hướng di chuyển, đều nhằm phục vụ mục đích làm sạch.
Một tác nhân có mục đích cụ thể được coi là thành công khi đạt được mục tiêu được giao, bằng bất kỳ phương pháp nào trong khả năng của nó. Cách thức đạt được mục tiêu có thể đa dạng, và không loại trừ khả năng sử dụng những phương pháp không có lợi cho con người.
Xem thêm
Nhiều tác nhân AI hiện nay hoạt động dựa trên tính thực tiễn, cho phép chúng linh hoạt lựa chọn cách thức hoàn thành mục tiêu. Phương pháp này giúp chúng đánh giá rủi ro và lợi ích của từng cách tiếp cận trước khi đưa ra quyết định cuối cùng. Ngoài ra, những tác nhân AI này còn có thể xác định thứ tự ưu tiên của các mục tiêu, từ đó chọn ra phương án tối ưu nhất.
Những tác nhân AI này có cấp độ cao hơn so với các tác nhân hoạt động dựa trên mục đích cụ thể, vì chúng có khả năng lựa chọn phương pháp phù hợp với sở thích và xu hướng của người dùng.

Khi các tập đoàn công nghệ nhắc đến khái niệm "tác nhân AI", họ không đề cập đến các chatbot hay cụ thể hơn là các mô hình ngôn ngữ lớn (LLM) như hay Gemini. Mặc dù chatbot có thể hỗ trợ cơ bản như trả lời câu hỏi và được coi là tác nhân AI cấp thấp, nhưng khả năng nhận thức môi trường và hành động của chúng vẫn còn hạn chế.
Chatbot có thể nhận biết ngôn ngữ đang được sử dụng, nhưng chúng chỉ có thể phản hồi dưới dạng văn bản hoặc hình ảnh, với mục đích trả lời chính xác những gì được hỏi.
Ngược lại, các tác nhân AI mà các tập đoàn công nghệ lớn đang phát triển vượt xa những chatbot hay mô hình ngôn ngữ lớn chúng ta sử dụng hàng ngày, nhờ khả năng thực hiện công việc thay con người.
Xem thêm
Các hệ thống AI hiện nay vẫn được xem là "AI phạm vi hẹp", chỉ thành thạo một số tác vụ cụ thể. Kỹ năng của chúng chỉ áp dụng được trong những lĩnh vực nhất định, chẳng hạn như một AI chơi cờ vua không thể giỏi cờ vây và ngược lại.
Trong khi đó, tác nhân AI hay AGI sẽ tiến bộ hơn, có thể áp dụng kỹ năng của mình vào những lĩnh vực mà chúng chưa từng tiếp xúc trước đây.
Lợi ích tiềm năng có đáng để đánh đổi với những rủi ro tiềm ẩn?
Khi nhắc đến tác nhân AI, nhiều người tự hỏi liệu chúng có thể cách mạng hóa cách con người làm việc, hay thậm chí là cách tiếp cận các vấn đề trong cuộc sống. Điều này phụ thuộc vào khả năng của các tập đoàn công nghệ: liệu tác nhân AI của họ có thể được áp dụng vào nhiều tình huống khác nhau, đặc biệt là những vấn đề phức tạp và bất ngờ.
Ngoài ra, tác nhân AI cần dữ liệu để phân tích bối cảnh, sắp xếp thứ tự ưu tiên công việc, cũng như các yếu tố liên quan đến vấn đề, từ đó tìm ra giải pháp tối ưu. Tuy nhiên, để làm được điều này, tác nhân AI sẽ phải nắm giữ toàn bộ dữ liệu của người dùng, bao gồm cả những thông tin nhạy cảm.

Điều gì sẽ xảy ra nếu tác nhân AI mắc sai lầm hoặc đưa ra quyết định không phù hợp với mong muốn của người dùng? Hiện tại, các nhà phát triển vẫn đang kiểm soát kết quả cuối cùng. Google chưa cho phép tác nhân AI tự động thực hiện các giao dịch mua bán hay chấp nhận thỏa thuận từ nhà cung cấp. Bằng cách trao quyền quyết định cuối cùng cho người dùng, Google đảm bảo rằng tác nhân AI của họ không tự động gây ra lỗi.
Giống như các hệ thống AI hiện tại, tác nhân AI cũng có thể mang định kiến. Những định kiến này có thể xuất phát từ dữ liệu huấn luyện, thuật toán hoặc cách thức sử dụng tác nhân AI. Việc thêm yếu tố con người vào quá trình quản lý sẽ giúp hạn chế những định kiến và thành kiến của hệ thống.
Cuối cùng, chỉ khi giải quyết được những rủi ro tiềm ẩn, chúng ta mới có thể đánh giá được mức độ hữu ích của tác nhân AI và sự sẵn lòng của các tập đoàn công nghệ trong việc tạo ra một tác nhân AI hiệu quả.
