Trung Quốc công bố AI chuyên giải toán, nhắm đến việc vượt qua và Gemini

Buzz

Ngày cập nhật gần nhất: 15/6/2026

Nội dung bài viết

Mô hình ngôn ngữ lớn Qwen2-Math do Alibaba phát triển hứa hẹn sẽ giúp xử lý những bài toán phức tạp.

Xem thêm

Đọc tóm tắt

- Mô hình Qwen2-Math của Alibaba, tập trung vào toán học, hứa hẹn xử lý các bài toán phức tạp, vượt qua GPT-.
- Qwen2-Math có ba phiên bản, với mô hình Qwen2-Math-72B-Instruct vượt trội trong các bài kiểm tra toán học so với GPT-, Claude Sonnet, Gemini 1.5 Pro và Llama-3.1-405B.
- Mô hình đã được thử nghiệm với nhiều chuẩn toán học và xếp thứ hai trong bảng xếp hạng LLM của SuperClue, gần gũi với các mô hình hàng đầu của Mỹ.
- Qwen2-72B đứng thứ 20 trong bảng xếp hạng độc lập của LMSYS.

Mô hình ngôn ngữ lớn Qwen2-Math do Alibaba phát triển hứa hẹn sẽ giúp xử lý những bài toán phức tạp.

Alibaba đang nỗ lực nâng cao tiêu chuẩn trong phát triển AI với việc giới thiệu Qwen2-Math, một nhóm mô hình ngôn ngữ lớn (LLM) tập trung vào toán học. Công ty thương mại điện tử này kỳ vọng mô hình này sẽ vượt qua khả năng của GPT-.

“Trong năm qua, chúng tôi đã đầu tư nhiều công sức vào việc nghiên cứu và cải thiện khả năng giải toán của các mô hình ngôn ngữ lớn, đặc biệt là khả năng giải quyết các bài toán số học”, nhóm Qwen cho biết trên GitHub.

Các mô hình ngôn ngữ lớn của Alibaba được phát hành từ tháng 6 và có ba phiên bản với số lượng tham số khác nhau. Tham số là những yếu tố giúp AI học cách đưa ra kết quả chính xác từ dữ liệu đầu vào.

AI của Alibaba chuyên giải toán đã vượt qua GPT-, Claude Sonnet và Gemini. (Ảnh minh họa: Shutterstock)

Theo thông tin từ nhóm Qwen, mô hình Qwen2-Math-72B-Instruct, với số lượng tham số lớn nhất, đã chứng tỏ mình vượt trội hơn các LLM hàng đầu của Mỹ trong các bài kiểm tra toán học. Các LLM này bao gồm GPT-, Claude Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama-3.1-405B của Meta Platforms.

Nhóm phát triển hy vọng rằng Qwen2-Math sẽ góp phần đáng kể vào việc giải quyết các bài toán phức tạp trong cộng đồng.

Các mô hình Qwen2-Math đã được thử nghiệm với các chuẩn toán học bằng tiếng Anh và tiếng Trung, bao gồm GSM8K với 8.500 bài toán tiểu học ngôn ngữ nâng cao, OlympiadBench với các bài kiểm tra khoa học đa ngữ cấp cao, và kỳ thi cao khảo của Trung Quốc.

Vào tháng 7, mô hình Qwen2-72B-Instruct xếp thứ hai chỉ sau GPT- và Claude Sonnet trong bảng xếp hạng LLM của SuperClue, nền tảng đánh giá dựa trên các yếu tố như năng lực tính toán, suy luận logic và hiểu văn bản.

SuperClue cho biết sự chênh lệch giữa các mô hình AI của Trung Quốc và Mỹ đang ngày càng thu hẹp, đồng thời ghi nhận tiến bộ đáng kể của Trung Quốc trong việc phát triển các LLM nội địa trong nửa đầu năm nay.

Một bài kiểm tra độc lập được công bố vào tháng 7 bởi LMSYS, tổ chức nghiên cứu hỗ trợ bởi Đại học California, Berkeley, đã xếp hạng Qwen2-72B ở vị trí 20, trong khi các mô hình của OpenAI, Anthropic và Google chiếm đa số trong top 10.

Các câu hỏi thường gặp

Mô hình ngôn ngữ Qwen2-Math của Alibaba có gì nổi bật?

Qwen2-Math nổi bật với khả năng giải toán phức tạp vượt trội so với các mô hình ngôn ngữ lớn khác như GPT- và Claude Sonnet, nhờ vào số lượng tham số lớn và cải tiến trong nghiên cứu AI.

Qwen2-Math có thể giải quyết các bài toán nào trong lĩnh vực toán học?

Qwen2-Math đã được thử nghiệm với nhiều chuẩn toán học, bao gồm GSM8K và OlympiadBench, cho thấy khả năng giải quyết các bài toán tiểu học và khoa học đa ngữ một cách hiệu quả.

Alibaba có kế hoạch gì cho mô hình Qwen2-Math trong tương lai?

Alibaba dự kiến sẽ tiếp tục nghiên cứu và phát triển Qwen2-Math để cải thiện khả năng giải quyết bài toán phức tạp, góp phần nâng cao tiêu chuẩn trong lĩnh vực trí tuệ nhân tạo.

Liệu Qwen2-Math có thể cạnh tranh với các LLM khác không?

Có, Qwen2-Math đã chứng minh khả năng cạnh tranh khi xếp hạng cao trong các bài kiểm tra và bảng xếp hạng so với các LLM hàng đầu của Mỹ, cho thấy sự tiến bộ vượt bậc của AI Trung Quốc.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]