Theo VTV.vn, các hệ thống AI hiện nay đang có những bước nhảy vọt ấn tượng về khả năng suy luận logic
Một sự kiện đặc biệt diễn ra tại Berkeley, California vào giữa tháng 5, nơi 30 nhà toán học hàng đầu thế giới tập trung không phải để giảng dạy mà để thử thách o4-mini - mô hình AI đặc biệt của OpenAI chuyên về giải các bài toán phức tạp
Trong suốt 48 giờ thử thách, các giáo sư liên tục đưa ra những bài toán ở mức độ tiến sĩ và mở rộng. Thay vì tìm ra hạn chế, họ bất ngờ khi o4-mini không chỉ giải quyết được những bài toán khó nhất mà còn đưa ra lời giải với lập luận chặt chẽ đến mức được ví như 'đạt trình độ thiên tài toán học'

Mô hình o4-mini thể hiện năng lực toán học xuất chúng tại hội nghị đặc biệt - Ảnh: ThisisEngineering/Unsplash.
Khác với các mô hình ngôn ngữ lớn truyền thống, o4-mini tuy có kiến trúc tối ưu hơn nhưng được đào tạo trên nguồn dữ liệu chuyên sâu kết hợp cơ chế học tăng cường tiên tiến, giúp nó xử lý được những bài toán phức tạp vượt xa khả năng của các LLM thông thường
Để đánh giá khả năng của o4-mini, OpenAI đã phối hợp với Epoch AI - tổ chức phi lợi nhuận chuyên đánh giá các mô hình ngôn ngữ - xây dựng bộ 300 bài toán chưa có lời giải. Kết quả đáng kinh ngạc khi o4-mini giải quyết được nhiều bài toán mà các mô hình mạnh nhất trước đây chỉ đạt tỷ lệ thành công dưới 2%
Vào tháng 9/2024, Epoch AI đã tuyển dụng Elliot Glazer - một tiến sĩ toán học mới tốt nghiệp - tham gia dự án đánh giá năng lực FrontierMath. Dự án này tập hợp các bài toán ở nhiều mức độ từ đại học đến trình độ nghiên cứu chuyên sâu.
Đến tháng 4/2025, Glazer nhận thấy o4-mini có thể giải quyết khoảng 20% bài toán. Anh mở rộng sang cấp độ thứ tư - những bài toán thách thức ngay cả chuyên gia. Các nhà toán học tham gia phải ký cam kết bảo mật, chỉ giao tiếp qua Signal để tránh rò rỉ thông tin ảnh hưởng đến tính khách quan của đánh giá.
Khi yêu cầu o4-mini giải bài, chỉ trong 10 phút, chatbot đã trình bày lời giải trực tiếp cùng quá trình suy nghĩ. Nó dành 2 phút đầu nghiên cứu tài liệu, sau đó thử giải phiên bản đơn giản hơn trước khi đưa ra đáp án chính xác cho bài toán gốc với phong cách đầy tự tin.
Ken Ono - nhà toán học Đại học Virginia kiêm trưởng ban tổ chức - kể lại: o4-mini có những phản hồi hóm hỉnh như 'Không cần trích dẫn vì con số này do tôi tự tính!', thể hiện khả năng tương tác đáng kinh ngạc.

Các chuyên gia rời hội nghị với cảm xúc lẫn lộn. o4-mini không chỉ nhanh mà còn thể hiện sự tự tin đến mức dễ thuyết phục, vượt xa khả năng của nhiều nghiên cứu sinh xuất sắc, như nhận xét của giáo sư Yang Hui He.
Ono chia sẻ: 'Tôi từng nói rằng quan điểm cho rằng AI tổng quát không thể đạt được là sai lầm. Dù không muốn gây hoang mang, nhưng ở nhiều khía cạnh, các LLM hiện đã vượt trội hơn phần lớn nghiên cứu sinh giỏi nhất'.
Sự kiện này đặt ra câu hỏi quan trọng: Khi AI giải được những bài toán vượt quá khả năng con người, vai trò của nhà toán học sẽ thay đổi thế nào? Có lẽ họ sẽ chuyển từ người giải toán sang người đặt câu hỏi - một vị trí sáng tạo không kém trong thời đại AI.
Khi hội nghị kết thúc, các nhà toán học bắt đầu hình dung về tương lai của ngành. Họ thảo luận về những bài toán cấp độ 5 - những thách thức cực kỳ phức tạp mà ngay cả những bộ óc toán học xuất sắc nhất cũng khó có thể giải quyết.
Nhóm chuyên gia nhận định rằng khi AI đạt đến trình độ cao như vậy, công việc của các nhà toán học sẽ có sự thay đổi căn bản: từ việc tự giải bài toán sang đặt câu hỏi và hợp tác với AI để khám phá chân lý toán học, tương tự như mối quan hệ giữa giáo sư và nghiên cứu sinh. Ono nhấn mạnh tầm quan trọng của việc đào tạo tư duy sáng tạo trong giáo dục đại học để duy trì sự phát triển của toán học.
Theo Scientific American
