Grok 3 liệu có thật sự mạnh mẽ như những lời đồn đại?
Grok 3, sản phẩm mới nhất từ xAI, được Elon Musk ra mắt trong buổi livestream trên X vào ngày 17/2 vừa qua. Phiên bản này gồm các mô hình lý luận Grok 3 Reasoning (beta) và Grok 3 mini Reasoning. Những mô hình này được đánh giá vượt trội hơn các mô hình tạo sinh tiêu chuẩn như GPT-4 nhờ khả năng "suy nghĩ" và giải quyết vấn đề, giảm thiểu khả năng đưa ra thông tin sai lệch.
Công ty xAI tự hào giới thiệu Grok 3 là mô hình vượt trội trên thị trường, khẳng định nó vượt qua các đối thủ lớn như OpenAI, Google, Anthropic và DeepSeek trong các bài kiểm tra quan trọng. Mặc dù ra mắt muộn, Grok 3 đã nhanh chóng đuổi kịp đối thủ và đạt được thành tựu ấn tượng. Tuy nhiên, nó vẫn có một số hạn chế giống như các mô hình AI tiên tiến khác. Đây là những đánh giá từ các chuyên gia AI về chatbot mới này.
Grok 3 có tiềm năng nhưng chưa đủ để thay thế .
OpenAI, công ty hàng đầu trong lĩnh vực trí tuệ nhân tạo với công cụ nổi tiếng, giờ đây đang đối diện với đối thủ mạnh mẽ. Grok 3 của Elon Musk tiếp tục chứng minh sự cạnh tranh quyết liệt trong thị trường chatbot AI, khi DeepSeek cũng đã tham gia vào cuộc đua này.

Andrej Karpathy (thành viên sáng lập OpenAI và cựu giám đốc AI tại Tesla) đã được tiếp cận Grok 3 ngay khi phiên bản mới được phát hành và chia sẻ "đánh giá nhanh" về hiệu suất của mô hình. Dựa trên một số bài kiểm tra tiêu chuẩn, Karpathy nhận định rằng Grok 3 với tính năng Deep Search Reasoning mới, "có thể so sánh với những mô hình mạnh nhất của OpenAI (o1-pro, 200 USD/tháng), và nhỉnh hơn một chút so với DeepSeek-R1 và Gemini 2.0 Flash Thinking".
Nhiều người cho rằng Grok 3 đã bắt kịp các đối thủ. Tuy nhiên, đối với những ai tìm kiếm mô hình tốt nhất trên thị trường, kết quả này có thể vẫn chưa đủ thuyết phục. Giáo sư Ethan Mollick (trường Wharton AI) đã chia sẻ trên mạng xã hội X: "Tôi nghĩ Grok 3 đã đạt đúng như kỳ vọng. Vì vậy, tôi cho rằng nó không cần phải cập nhật quá nhiều."
xAI đã bỏ qua một so sánh quan trọng với Grok 3.
Những hình ảnh chụp màn hình cho thấy Grok 3 Reasoning vượt trội hơn OpenAI o3 mini và o1, DeepSeek R1, Google Gemini 2.0 Flash Thinking đã lan truyền mạnh mẽ. Tuy nhiên, OpenAI đã phản bác: "Chưa chắc đâu!". Ngay sau khi kết quả được chia sẻ, kỹ sư sản phẩm Rex Asabor (OpenAI) đã đăng một biểu đồ "cập nhật" cho thấy O3 vượt trội hơn Grok 3 Reasoning trong các bài kiểm tra toán học và khoa học.
Công bằng mà nói, O3 vẫn chưa được phát hành công khai, vì vậy xAI có thể chưa có đủ dữ liệu để so sánh. Trong một bài đăng khác trên X, giáo sư Mollick cho rằng Grok 3 là "một mô hình rất tốt hiện đang ở vị trí tiên phong" và nhận định: "Điều quan trọng cần chú ý là nó đã đạt được điều này rất nhanh và liệu điều đó có tiếp tục hay không".

Elon Musk cho biết Grok 3 được huấn luyện với sức mạnh tính toán gấp 10 lần Grok 2, sử dụng 200.000 GPU. Điều này, ít nhất trong ngắn hạn, củng cố quy luật tỷ lệ: Khả năng tính toán càng cao thì hiệu suất mô hình càng tốt. Tuy nhiên, giới chuyên gia vẫn nghi ngờ liệu mô hình này có mang lại trí thông minh cao hơn so với những gì hiện tại có thể đạt được.
Nhà nghiên cứu AI kiêm giáo sư tâm lý học và khoa học thần kinh Gary Marcus (Đại học New York) vẫn hoài nghi về việc quy luật tỷ lệ này còn đúng trong tương lai hay không.
Musk thừa nhận rằng mô hình này vẫn đang trong quá trình hoàn thiện: "Chúng tôi phải nhấn mạnh rằng đây là phiên bản beta, nghĩa là ban đầu bạn sẽ thấy một số khiếm khuyết, nhưng chúng tôi sẽ cải thiện nó nhanh chóng, hầu như mỗi ngày".
Ông cũng cho biết tính năng hỗ trợ giọng nói cho Grok 3 sẽ được ra mắt sau.
