Mặc dù không tối ưu chi phí như DeepSeek, nhưng Grok-3 lại sở hữu một điểm đặc biệt mà ngay cả cũng phải ao ước: sự đầu tư khổng lồ từ Elon Musk.
Mới đây, tỷ phú Elon Musk đã trải qua một phen bẽ mặt khi chính chatbot AI của mình, Grok-3, làm lộ khuyết điểm. Trước đó, ông đã ca ngợi AI 'con đẻ' vì có thể giải một bài toán khó trong kỳ thi Putnam chỉ trong vài phút, nhưng không lâu sau, chính chatbot này thừa nhận rằng lời giải của mình là sai do hiểu lầm về tham số.
Đây không phải lần đầu tiên Grok-3 khiến ông chủ của mình phải xấu hổ trước cộng đồng người dùng. Trước đó, chatbot này đã tuyên bố rằng Elon Musk là một trong những nguồn phát tán tin giả lớn nhất thế giới. Sau đó, đội ngũ lập trình đã phải vô hiệu hóa khả năng trả lời các câu hỏi tương tự.
Những sự cố này đặt ra câu hỏi liệu Grok-3 có thật sự là AI thông minh nhất Trái Đất như Elon Musk đã khẳng định, hay chỉ là một lời tuyên bố giống như 'con hát mẹ khen hay'? Và ông Musk dựa vào đâu để nói rằng Grok-3 là AI thông minh nhất hiện nay?

Câu hỏi này đã được giải đáp phần nào qua bài viết của chuyên gia công nghệ Nguyễn Hồng Phúc trên Facebook của ông.
Theo ông Phúc, Grok-3 thực sự khá thông minh chứ không phải chỉ là một tuyên bố gây sốc của Elon Musk. Để chứng minh điều này, chúng ta có thể nhìn vào các tính năng nổi bật của chatbot AI này.
+ Grok-3 là một mô hình AI Ngôn Ngữ lớn, được huấn luyện từ dữ liệu của mạng xã hội Twitter (X), giúp nó giao tiếp với khả năng 'giống người' đến mức tuyệt đối.
+ Năng lực tư duy và suy luận của Grok-3 đạt mức cao nhất so với các mô hình reasoning khác như OpenAI O1, O3-mini, DeepSeek R1, Gemini-2 Flash Thinking, đặc biệt trong các tác vụ đòi hỏi khả năng suy luận logic, như toán học và lập trình.

Chuyên gia công nghệ Nguyễn Hồng Phúc
+ Grok-3 có tính năng AI Agent tìm kiếm và tổng hợp thông tin thành báo cáo 'Cơ bản', nhưng vẫn kém xa so với OpenAI Deep Research, chính vì vậy mà xAI gọi nó là Deep Search.
+ AI Grok-3 sở hữu khả năng đa giác quan cơ bản, như đọc hình ảnh và các tệp cơ bản, tuy nhiên nó chưa thể xem video hay nghe âm thanh. Bên cạnh đó, nó cũng không có khả năng tạo ra hình ảnh hay âm thanh.
+ Ứng dụng AI Chatbot Grok có thể sử dụng trên mạng xã hội X (Web, iOS, Android) hoặc qua app riêng. Về cơ bản, ứng dụng này không có gì đặc biệt so với các AI Chatbot khác, ngoại trừ tính năng Follow-up Questions, cho phép AI tự gợi ý các câu hỏi tiếp theo, giúp người dùng dễ dàng chọn lựa mà không cần suy nghĩ. Đây là một bước tiến về giao diện và chức năng so với các chatbot hiện tại.
Việc tích hợp trực tiếp chatbot AI này vào nền tảng mạng xã hội X.com có lẽ là lý do khiến Grok-3 gây bất ngờ với người dùng nhờ khả năng 'nói chuyện tự nhiên như con người.'

Hệ thống siêu máy tính vận hành Grok-3 có quy mô khổng lồ.
Tuy nhiên, theo ông Phúc, điều đáng chú ý nhất của Grok-3 không phải là sự đột phá công nghệ, mà là khoản đầu tư khổng lồ mà Elon Musk đã dành cho AI này: 6 tỷ USD cho hệ thống Siêu máy tính Colossus, với 200.000 GPU NVIDIA H100 (mới nhất và đắt nhất của NVIDIA), và dự kiến sẽ có đến 1 triệu GPU H100 vào cuối năm nay.
Siêu máy tính này rộng lớn đến mức chiếm đến 200 hecta đất tại Memphis, bang Tennessee, Mỹ. Chi phí điện để vận hành nó gần tương đương với chi phí điện của một thành phố.
Một AI mang lại 'cảm giác thông minh tuyệt đỉnh'
Điều thú vị thứ hai là cách mà Elon Musk tạo ra 'cảm giác AI thông minh' cho Grok-3. Thay vì thực sự tạo ra một AI thông minh, ông Musk đã thiết kế Grok-3 để 'nói chuyện giống hệt con người'.
Việc mua lại Twitter đã giúp Elon Musk nắm được một kho dữ liệu khổng lồ và vô cùng giá trị từ mạng xã hội này. Hàng tỉ tỉ bài tweet trở thành kho dữ liệu AI mà các nhà phát triển đều ao ước. Những tweet này chứa thông tin ngắn gọn, dễ dàng làm sạch và thể hiện giao tiếp thuần tuý của con người, vì mỗi tweet chỉ có 140 đến 200 ký tự, rất cô đọng và dễ hiểu.
Theo ông Phúc, Twitter là mạng xã hội nơi người trưởng thành, có trí thức và quan điểm riêng sử dụng. Điều này khác biệt hoàn toàn với Facebook, nơi chứa dữ liệu đa phương tiện với hình ảnh, video, và các bài đăng dài, chủ yếu dành cho giới trẻ và ít có tính thời sự, tức thời như Twitter.

Không giống như , Grok-3 không phải là công cụ độc lập mà được tích hợp và sử dụng thông qua tài khoản X.com.
Nền tảng X (hay Twitter) chính là kho dữ liệu tạo nên khả năng 'nói chuyện như người thật' của Grok-3. Dữ liệu huấn luyện vào sạch sẽ, súc tích, mang quan điểm rõ ràng và cảm xúc như con người, chính là lý do khiến Grok-3 có thể giao tiếp tự nhiên, thậm chí nói những từ ngữ tục tĩu như người thật.
Điều đặc biệt về dữ liệu huấn luyện của Grok-3 là AI này không bị kiểm duyệt nội dung theo hình thức 'tiền kiểm'. Kiểm duyệt nội dung là biện pháp an toàn mà các nhà phát triển AI áp dụng để ngăn AI nói những điều không phù hợp theo chuẩn mực xã hội hiện đại.
Các chatbot AI như , Gemini, Claude, đặc biệt là DeepSeek, đều bị kiểm duyệt nội dung rất nghiêm ngặt. Việc này thường diễn ra ngay từ giai đoạn huấn luyện dữ liệu, nhằm ngăn AI tiếp cận các thông tin sai lệch hoặc lệch chuẩn. Sau đó, ở 'hậu kiểm', AI sẽ bị ngừng trả lời nếu người dùng đưa ra câu hỏi nhạy cảm hoặc gây tranh cãi.
Đối với Grok-3, Elon Musk luôn muốn đây là một AI tự do, đúng như tuyên ngôn của Twitter. Người dùng trên nền tảng này sẽ nói gì thì AI sẽ học theo đó, dù đó là vấn đề gây tranh cãi. Chính vì vậy, Grok-3 có thể tạo cảm giác 'nói chuyện cực kỳ thông minh và giống con người', vì AI này phản ánh cả mặt tốt lẫn mặt xấu của con người, giúp nó hoàn thiện hơn những AI khác.

Các dòng lệnh được thêm vào để Grok-3 không trả lời các câu hỏi về việc Elon Musk phát tán tin giả.
Tuy nhiên, theo ông Phúc, cách đây hai ngày, trong System Prompt mới nhất của Grok-3, xAI đã thêm vào một số yêu cầu 'hậu kiểm', yêu cầu Grok-3 không trả lời về việc Elon Musk và Tổng thống Trump đã phát tán tin giả hay tin sai lệch.
Học hỏi không giới hạn, không ngừng nghỉ
Điều thú vị thứ 3 là Grok-3 có khả năng cập nhật kiến thức theo thời gian thực. Để chứng minh điều này, ông Phúc đã tìm cách để Grok-3 tiết lộ System Prompt của mình, giúp người dùng hiểu rõ hơn về cách hoạt động của Grok.
Trong System Prompt, có dòng chữ sau:
* Kiến thức của bạn luôn được cập nhật liên tục - không có giới hạn thời gian cắt đứt kiến thức.
* Sử dụng kiến thức trong ngữ cảnh từ các công cụ để cập nhật theo thời gian thực.
Điều này có nghĩa là Grok-3 được chỉ thị luôn trả lời với thông tin được cập nhật liên tục, không có thời gian cắt đứt kiến thức, và nó sử dụng kiến thức mới được bổ sung vào 'ngữ cảnh' của AI thông qua các 'Công cụ' (Tools).

Điều này không phải là phép màu công nghệ gì phức tạp, mà đơn giản là Grok-3 sẽ sử dụng các công cụ để truy vấn thông tin bên ngoài và bổ sung vào 'ngữ cảnh' của AI để trả lời. Các công cụ mà Grok-3 có thể sử dụng bao gồm tìm kiếm web qua Google hoặc Brave, tìm kiếm nội dung Tweets trên Twitter, và công cụ đọc các file mà người dùng đã tải lên trước đó trên Grok.
Điều thú vị thứ 4:
Grok-3 sở hữu tính năng AI Agent đầu tiên của nó, mang tên AI DeepSearch, có nhiều điểm tương đồng với Deep Research của OpenAI. Câu trả lời mà Grok đưa ra qua AI Agent DeepSearch thường ngắn gọn hơn, không chi tiết như AI Agent DeepResearch, vì vậy có lẽ tính năng này được gọi là DeepSearch, tức là tìm kiếm sâu, không phải Nghiên Cứu Sâu.

Tính năng DeepSearch của Grok-3 được triển khai tương tự như DeepResearch của , nhưng kém hơn một chút.
Theo ông Phúc, một trong những điểm nổi bật về khả năng suy luận của Grok-3 là nó có thể hỏi lại người dùng để làm rõ câu hỏi, sau đó tự tạo ra 'Luận Điểm Nền' (Thesis) để tiến hành tìm kiếm, rồi phân tích kết quả để xác định hướng tìm kiếm tiếp theo. Grok-3 có thể lặp lại quá trình tìm kiếm ít nhất ba lần, rồi tổng hợp các luận điểm và kết quả tìm kiếm thành một báo cáo ngắn gọn.
Đặc biệt, xAI sử dụng kỹ thuật few-shot learning, đưa vào System Prompt một số ví dụ về cách thực hiện DeepSearch để AI có thể học theo. Thông qua kịch bản tìm kiếm mẫu, Grok 3 dường như bắt chước được cách 'suy nghĩ', lý luận, tìm kiếm và đánh giá kết quả.
Theo ông Phúc, tính năng AI Agent của Grok không phải là sự kết hợp của nhiều tác nhân cùng lúc (Multi-Agent), mà là một AI thực hiện tuần tự nhiều tác vụ trong một 'Super-Prompt' (một Prompt dài mô tả chi tiết các bước công việc mà AI phải làm). Đây là một dạng AI Agent cơ bản, không phức tạp trong việc tạo ra và huấn luyện (hầu như không cần huấn luyện).
Một khả năng độc đáo khác của Grok 3 là khả năng xử lý một lượng lớn văn bản đầu vào (Large Context Window). Trong buổi livestream giới thiệu Grok, ông Musk và đội ngũ xAI cho biết Grok 3 có thể xử lý lên tới 1 triệu tokens đầu vào. Đây là công ty thứ hai sau Google có thể cung cấp AI với khả năng xử lý văn bản đầu vào lên tới 1 triệu tokens. Dĩ nhiên, khả năng này không đến từ đột phá công nghệ mà chủ yếu nhờ vào hạ tầng máy chủ khổng lồ mà ông Musk đang triển khai cho Grok-3.
Điểm đặc biệt nhất mà Grok-3 có được so với các AI khác chính là hạ tầng khổng lồ và nền tảng mạng xã hội X của ông Elon Musk. Tuy nhiên, việc Grok-3 hoạt động như một tính năng của X.com lại tạo ra một sự hạn chế trong việc tích hợp với các nhà phát triển khác, thông qua việc cung cấp API như hay Claude AI đang làm. Dù vậy, đường đua AI còn dài, và liệu những lợi thế này có giúp Grok-3 theo kịp các đối thủ đi trước hay không vẫn cần phải chờ đợi thời gian trả lời.
