Sự xuất hiện của mô hình ngôn ngữ mới của DeepMind khiến cho GPT-3 phải bất bại

Buzz

Ngày cập nhật gần nhất: 15/5/2026

Nội dung bài viết

Mô hình ngôn ngữ mới của DeepMind với 280 tỷ tham số vượt xa GPT-3 về độ chính xác

Xem thêm

Đọc tóm tắt

- Mô hình ngôn ngữ mới của DeepMind, Gopher, với 280 tỷ tham số, vượt trội hơn GPT-3 về độ chính xác và hiệu suất.
- Gopher lớn hơn GPT-3 khoảng 60% và nhỏ hơn mô hình LLM của Google với 1 nghìn tỷ tham số.
- DeepMind đã cải thiện khả năng của Gopher bằng cách tối ưu hóa cách phân phối tài nguyên, đạt kết quả tốt hơn 80% các bài kiểm tra.
- Thay vì chỉ tăng kích thước mô hình, DeepMind tập trung vào việc tối ưu hóa hiệu suất của mô hình nhỏ hơn.

Mô hình ngôn ngữ mới của DeepMind với 280 tỷ tham số vượt xa GPT-3 về độ chính xác

Buông lỏng đi, GPT-3, có một đối thủ mới năng động tranh giành vương miện của mô hình ngôn ngữ xuất sắc nhất thế giới, và đến từ những người bạn cũ tại DeepMind.

Ngay từ đầu: Công ty con của Alphabet ở Anh, đã giải quyết câu hỏi liệu con người hay máy tính giỏi hơn ở cờ vua một cách dứt khoát - máy tính đã chiến thắng - và giờ đây họ đã nhắm mục tiêu vào thế giới của các mô hình ngôn ngữ lớn (LLM).

Để đạt được mục tiêu đó, họ vừa công bố "Gopher", một mô hình ngôn ngữ có khoảng 60% lớn hơn về tham số so với GPT-3 và khoảng một phần tư kích thước của LLM của Google với 1 nghìn tỷ tham số.

Theo thông cáo báo chí trên blog của DeepMind:

Trong nghiên cứu của chúng tôi, chúng tôi phát hiện ra rằng khả năng của Gopher vượt trội so với các mô hình ngôn ngữ hiện tại đối với nhiều nhiệm vụ quan trọng. Điều này bao gồm cả bài kiểm tra Massive Multitask Language Understanding (MMLU), trong đó Gopher chứng minh sự tiến bộ đáng kể đến hiệu suất của chuyên gia con người so với công việc trước đó.

Hội nghị TNW 2024 - Kêu gọi tất cả các Startups tham gia vào ngày 20-21 tháng 6

Trưng bày Startup của bạn trước nhà đầu tư, những người thay đổi và khách hàng tiềm năng với gói Startup được tạo ra đặc biệt của chúng tôi.

ĐĂNG KÝ NGAY

Nền tảng: DeepMind đạt được những cải tiến bằng cách tập trung vào những lĩnh vực nơi việc mở rộng kích thước của mô hình AI mang lại ý nghĩa.

Mức công suất bạn có thể đẩy vào một mô hình AI, ví dụ, cho việc hiểu đọc, càng nhiều càng tốt. Nhưng nhóm phát hiện rằng các lĩnh vực khác của kiến trúc LLM không hưởng lợi nhiều từ sức mạnh brute force.

Bằng cách ưu tiên cách hệ thống sử dụng và phân phối tài nguyên, nhóm đã có thể điều chỉnh thuật toán của họ để vượt qua các mô hình tiên tiến hiện đại trong 80% các bài kiểm tra được sử dụng.

Credit: DeepMind

Nhóm DeepMind cũng đã công bố các bài nói về đạo đức và kiến trúc của LLM, bạn có thể đọc những bài nói đó tại đây và tại đây.

Ý kiến nhanh: Nói mượn từ nhà thơ vĩ đại Montell Jordan: đây là cách bạn thực hiện điều đó. Thay vì đưa lĩnh vực này vào bờ vực hủy hoại bằng cách tăng kích thước của mô hình một cách lũng đoạn cho đến khi GPT-5 hoặc GPT-6 lớn hơn cả vũ trụ đã biết, DeepMind đang cố gắng nén thêm sức mạnh từ những mô hình nhỏ hơn.

Đừng hiểu lầm, Gopher có đáng kể nhiều tham số hơn so với GPT-3. Nhưng, khi bạn cân nhắc rằng GPT-4 dự kiến sẽ có khoảng 100 nghìn tỷ tham số, có vẻ như DeepMind đang di chuyển theo hướng có vẻ khả thi hơn.

Các câu hỏi thường gặp

Gopher của DeepMind có những ưu điểm gì so với GPT-3?

Gopher vượt trội hơn GPT-3 nhờ có 280 tỷ tham số, cho phép nó đạt độ chính xác cao hơn trong nhiều nhiệm vụ ngôn ngữ. Nghiên cứu cho thấy Gopher đã chứng minh hiệu suất tốt hơn so với chuyên gia con người trong bài kiểm tra MMLU.

Tại sao DeepMind lại chọn tăng kích thước mô hình AI cho Gopher?

DeepMind tin rằng việc mở rộng kích thước mô hình AI sẽ cải thiện khả năng hiểu ngữ nghĩa và phân tích văn bản. Họ đã tối ưu hóa cách sử dụng và phân phối tài nguyên để đạt được kết quả tốt hơn mà không cần tăng kích thước một cách vô tội vạ.

DeepMind đã công bố điều gì liên quan đến đạo đức trong AI?

Nhóm DeepMind đã tổ chức các bài nói về đạo đức và kiến trúc của LLM, nhằm tăng cường sự hiểu biết và trách nhiệm trong việc phát triển mô hình ngôn ngữ lớn, điều này cho thấy họ rất chú trọng đến các vấn đề đạo đức trong công nghệ AI.

Gopher có phải là mô hình ngôn ngữ lớn nhất hiện nay không?

Không, mặc dù Gopher có 280 tỷ tham số, nhưng dự kiến GPT-4 sẽ có khoảng 100 nghìn tỷ tham số. Điều này cho thấy còn nhiều sự phát triển và cải tiến trong tương lai cho các mô hình ngôn ngữ.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]