Trong thử thách mang tên "Bài thi Cuối cùng", Grok 4 đã chứng minh năng lực vượt trội so với hai đối thủ đáng gờm là GPT-4 và Gemini.

Elon Musk trình làng Grok 4 với khả năng tư duy logic đột phá - Ảnh: AFP/Getty Images
Mới đây, xAI - công ty thuộc tập đoàn của Elon Musk đã chính thức công bố Grok 4, phiên bản AI thế hệ mới nhất. Dù được đánh giá cao về khả năng suy luận vượt trội, sự xuất hiện của Grok 4 cũng làm dấy lên những tranh cãi về vấn đề đạo đức và an ninh trong cuộc chạy đua AI đang ngày càng gay gắt.
AI với năng lực tư duy đỉnh cao, vượt mặt cả GPT-4 lẫn Gemini
Grok 4 đánh dấu bước nhảy vọt trong chiến lược phát triển của xAI, chuyển trọng tâm từ đào tạo dữ liệu khổng lồ sang tối ưu hóa hậu huấn luyện, đặc biệt chú trọng nâng cao khả năng giải quyết vấn đề, lập trình và tư duy khoa học. Không chỉ phát huy thế mạnh từ Grok 3, phiên bản mới còn xử lý được những chuỗi logic phức tạp hơn và được phát triển thành nhiều phiên bản chuyên sâu như Grok 4 Code để ứng dụng vào từng ngành nghề cụ thể.
Điểm nhấn ấn tượng là Grok 4 được xác nhận đạt thành tích cao chưa từng có trong "Kỳ thi cuối cùng của nhân loại" - bài kiểm tra gồm hơn 100 câu hỏi đa lĩnh vực từ toán, hóa đến ngôn ngữ. Thành tích này giúp Grok 4 vượt lên dẫn trước các đối thủ mạnh như GPT-4 và Gemini.
Theo Giáo sư Jimmy Ba - cựu học trò của Geoffrey Hinton (người được mệnh danh là "cha đẻ AI") và cũng là trưởng nhóm nghiên cứu dự án, tốc độ phát triển của Grok 4 đạt đến mức 'khó tin'. Thành công này có được nhờ việc xAI áp dụng siêu máy tính Colossus cho quá trình đào tạo mô hình, thay vì dựa vào các phương pháp huấn luyện AI thông thường.
Cơ sở hạ tầng đẳng cấp: Siêu máy tính, GPU và mô hình thương mại cao cấp
Grok 4 chính thức ra mắt đã làm nổi bật xu hướng phụ thuộc ngày càng sâu vào hệ thống phần cứng cao cấp trong ngành AI. Theo kế hoạch, xAI sẽ triển khai tới 100.000 GPU Nvidia GB200 để đào tạo mô hình tạo video, giúp tăng tốc độ xử lý lên 30 lần so với thế hệ trước.

Hình ảnh Elon Musk cùng các cộng sự trong buổi phát trực tiếp - Ảnh chụp màn hình.
Tuy nhiên, điều này dẫn đến chi phí vận hành và thương mại hóa tăng đột biến. Gói doanh nghiệp Grok 4 Heavy có giá lên tới 300 USD/tháng, với phí API là 3 USD cho mỗi triệu token đầu vào, phản ánh chiến lược định giá dựa trên tình trạng khan hiếm GPU. Đặc biệt, gói Heavy còn trang bị nhiều agent AI có khả năng tranh luận và phối hợp để giải quyết các vấn đề phức tạp.
Mục tiêu hướng tới: Tương tác thực tế và phát triển robot thông minh
Mặc dù chưa được tích hợp khả năng xử lý hình ảnh (dự kiến sẽ có từ Grok 6 hoặc 7), Grok 4 được thiết kế với định hướng rõ ràng về khả năng tương tác với môi trường thực tế.
Grok 4 tập trung phát triển khả năng tư duy logic và chuyên môn hóa theo từng ngành nghề, thể hiện xu hướng chuyển dịch trong ngành AI từ giai đoạn đào tạo sang giai đoạn tinh chỉnh sau đào tạo. Kiến trúc của Grok 4 được tối ưu để giải quyết các chuỗi suy luận phức tạp, đặc biệt trong các lĩnh vực toán học, lập trình và phân tích khoa học. Phiên bản Grok 4 Code chuyên biệt cho thấy thị trường AI đang phân nhánh khi các nhà phát triển tập trung vào hiệu suất chuyên ngành thay vì chỉ phát triển năng lực tổng hợp.
Grok 4 được xác nhận đạt thành tích cao nhất lịch sử trong "Kỳ thi cuối cùng của nhân loại" - bài kiểm tra đa ngành cực kỳ khó do các chuyên gia hàng đầu thiết kế, bao gồm các câu hỏi thuộc lĩnh vực toán học, hóa học và ngôn ngữ học mà theo Musk là "ngay cả chuyên gia cũng không thể tự giải quyết". Mô hình này đã vượt mặt các đối thủ mạnh như Gemini và GPT-4.
Giáo sư Jimmy Ba từ Đại học Toronto, cựu học trò của Geoffrey Hinton và là nhà nghiên cứu chính của Grok 4, tiết lộ mô hình đạt được "tốc độ phát triển chóng mặt" nhờ tận dụng siêu máy tính Colossus và nguồn tài nguyên tính toán khổng lồ, đặc biệt trong các bài toán học tăng cường và tối ưu hóa lập luận. Phương pháp này khác biệt hoàn toàn với cách tiếp cận ban đầu của Grok 3.
Rủi ro từ hiện tượng "ảo giác" và những vấn đề đạo đức chưa có lời giải
Ngay trước thềm ra mắt Grok 4, phiên bản tiền nhiệm Grok 3 đã gây tranh cãi khi đưa ra những phát ngôn không phù hợp. Dù xAI đã kịp thời khắc phục những sai sót này, công ty vẫn chưa công bố bất kỳ cơ chế kỹ thuật cụ thể nào để ngăn chặn tái diễn tình trạng tương tự ở Grok 4.
Trong sự kiện giới thiệu sản phẩm, đội ngũ nghiên cứu xAI đã không đề cập đến giải pháp xử lý các vấn đề thường gặp ở mô hình ngôn ngữ như hiện tượng "ảo giác" hay rủi ro an ninh, điều đáng lo ngại khi Grok 4 được định hướng ứng dụng trong các lĩnh vực nhạy cảm như nghiên cứu dược phẩm, robot và xe tự lái.
Tính năng trợ lý giọng nói đa âm sắc của Grok 4 cũng đặt ra những câu hỏi đạo đức về việc AI mô phỏng cảm xúc con người, làm mờ ranh giới giữa thực và ảo, giữa con người và máy móc.

Tạp chí Forbes nhận định sự ra mắt của Grok 4 đã thể hiện rõ nét 4 xu hướng chính đang làm thay đổi cục diện ngành công nghiệp AI hiện nay:
Lệ thuộc vào cơ sở hạ tầng tính toán: Khả năng của các hệ thống AI ngày nay phụ thuộc hoàn toàn vào nguồn lực GPU và các trung tâm dữ liệu cao cấp, biến cuộc đua AI thành sân chơi độc quyền của các tập đoàn công nghệ khổng lồ.
Chuyển dịch tiêu chuẩn đánh giá: Khả năng suy luận logic đã thay thế quy mô tham số mô hình để trở thành thước đo mới cho sức mạnh của các hệ thống trí tuệ nhân tạo.
Hướng tới tương tác vật lý: Các nghiên cứu về robot và mô hình thế giới ảo đang mở đường cho khả năng tương tác thực tế của AI trong môi trường vật chất.
AI trở thành sản phẩm cao cấp: Mô hình định giá phân khúc có nguy cơ làm gia tăng khoảng cách đổi mới công nghệ giữa các tập đoàn lớn và người dùng thông thường.
Cảnh báo từ trí thông minh vượt bậc
Elon Musk tuyên bố Grok có khả năng "tự mình khám phá ra những công nghệ đột phá vào cuối năm sau". Tuy nhiên, trong bối cảnh tốc độ phát triển vượt xa khả năng kiểm soát, thách thức lớn nhất của kỷ nguyên AI tổng quát đang dần lộ diện: liệu nhân loại có thể tìm được tiếng nói chung, đồng bộ hóa mục tiêu giữa con người và máy móc, trước khi chính AI định nghĩa lại tri thức và bản chất của loài người?

