Khi cần giải một phép toán, bạn nên sử dụng máy tính thay vì kỳ vọng vào các mô hình AI để giải quyết cho bạn.
Kể từ khi xuất hiện, các mô hình ngôn ngữ lớn đã thay đổi cách mà chúng ta xử lý công việc hàng ngày và trả lời các câu hỏi phức tạp. Nhiều người cho rằng những mô hình AI này có thể giải quyết tất cả các vấn đề, nhưng một lĩnh vực mà bạn không thể dựa vào chúng là giải toán.
Hãy tránh nhờ AI giải toán
Ngay cả những mô hình AI tiên tiến nhất về toán học cũng có tỷ lệ chính xác không cao. Các nhà nghiên cứu tại Trường Đại học Thanh Hoa, Trung Quốc, đã phát triển một mô hình AI chuyên biệt cho toán học có tên MathGLM để giải quyết các vấn đề toán học phức tạp.

Google Bard, mặc dù rất thông minh, vẫn không thể giải quyết được các phép toán phức tạp
Trên thực tế, các mô hình AI có thể học cách giải toán nếu được huấn luyện trên các bộ dữ liệu toán học lớn để nhận diện các mô hình phép tính, và khi kết hợp với các số nhỏ hơn, chúng có thể đưa ra các câu trả lời gần đúng.
Nếu chỉ so sánh về khả năng tính toán, MathGLM hoàn toàn vượt trội hơn và GPT-4 của OpenAI. Tuy nhiên, ngay cả với những phép tính 5 chữ số, mô hình AI 2 tỷ tham số này chỉ đạt độ chính xác 85,16%. Điều này hoàn toàn khác biệt so với máy tính thông thường, luôn cho kết quả chính xác 100%.
Khi con số trong phép tính lớn hơn, độ chính xác của MathGLM giảm nhanh chóng. Nguyên nhân có thể là do các phép tính với số nhỏ hơn thường xuất hiện trong bộ dữ liệu huấn luyện, khiến mô hình dễ nhận diện và đưa ra kết quả dựa trên dữ liệu huấn luyện hơn là thực sự tính toán.

Bảng thống kê cho thấy, với phép tính dài hơn, tỷ lệ chính xác của MathGLM giảm dần
Nếu sử dụng đúng cách, các mô hình AI có thể vượt qua con người về khả năng tính toán
Tuy nhiên, các nhà nghiên cứu tại Google đã chứng minh rằng nếu được áp dụng đúng cách, khả năng giải toán của các mô hình AI có thể vượt xa con người. Google mới đây đã giới thiệu phương pháp FunSearch, kết hợp một mô hình ngôn ngữ lớn với công cụ ước lượng tự động để tránh hiện tượng ảo giác và những ý tưởng không chính xác của mô hình AI.
Phương pháp này cơ bản là một quy trình lặp đi lặp lại, kết hợp sự sáng tạo của mô hình ngôn ngữ lớn với cơ chế tự động để nhận diện và điều chỉnh hướng đi sai. Dù các mô hình AI có thể không giỏi toán, nhưng chúng rất mạnh mẽ trong khả năng sáng tạo.

Nhờ việc kết hợp nhiều công cụ, FunSearch của Google có thể giải quyết các bài toán phức tạp hơn
Đối với các phép toán, FunSearch hoạt động bằng cách chuyển đổi mô tả bài toán thành các dòng mã. Mô tả này sẽ định hình một quy trình đánh giá kết quả và khởi động nhiều chương trình để tính toán lại. Mỗi lần lặp lại của FunSearch, hệ thống sẽ chọn một số chương trình và tải chúng vào mô hình ngôn ngữ lớn như PaLM 2 để tạo ra các chương trình mới. Những chương trình này sẽ được chọn để tiếp tục lặp lại, tạo ra một chu trình tự cải thiện.
Ví dụ, trong một phép tính, FunSearch có thể xác định các tập hợp giới hạn lớn hơn nhiều so với các tập hợp nổi tiếng của những nhà toán học hàng đầu thế giới. 'Theo tôi, đây là một khám phá khoa học lần đầu tiên được phát hiện nhờ sử dụng mô hình AI.' Các nhà nghiên cứu cho biết trong bài viết trên tạp chí Nature.
Tuy nhiên, máy tính vẫn là lựa chọn tốt hơn
Nghiên cứu của Google cho thấy, một mô hình ngôn ngữ có thể trở thành công cụ toán học mạnh mẽ nếu được sử dụng đúng cách, nhưng nó vẫn không thể tự giải quyết vấn đề và đưa ra ý tưởng mới mà không có sự hỗ trợ từ bên ngoài.

Dù phương pháp FunSearch của Google giúp giải quyết các vấn đề toán học bằng cách lặp đi lặp lại khả năng sáng tạo của mô hình AI, nhưng điều này không có nghĩa là chúng giỏi toán. Phương pháp này chỉ giúp hướng khả năng sáng tạo của mô hình vào đúng hướng thay vì tạo ra các ảo giác của AI.
Mô hình AI có thể rất hữu ích khi bạn cần giải thích lý thuyết toán học, chẳng hạn như cách nhân ma trận. Nhưng nếu yêu cầu chúng thực hiện phép nhân ma trận, kết quả có thể hoàn toàn sai lệch.
Nói chung, bạn có thể yêu cầu các mô hình AI làm nhiều việc, nhưng khi cần giải toán, tốt nhất bạn vẫn nên sử dụng một chiếc máy tính cầm tay.
