Google Dịch đang mở rộng thêm hơn 100 ngôn ngữ mới vào kho ngôn ngữ của mình, nâng tổng số ngôn ngữ có thể dịch lên gần 250.
Google ra mắt Google Dịch vào năm 2006 và từ đó đã liên tục bổ sung hỗ trợ cho nhiều ngôn ngữ hơn. Vào tháng 5, họ đã thêm 24 ngôn ngữ mới, đưa tổng số ngôn ngữ hỗ trợ lên 133.
Lần cập nhật gần đây nhất của Google Dịch là lớn nhất từ trước đến nay, với việc bổ sung 110 ngôn ngữ mới, nâng tổng số ngôn ngữ hỗ trợ lên 243.
So với Apple Translate (20 ngôn ngữ) và Microsoft Translator (135 ngôn ngữ), Google Dịch hiện đang dẫn đầu rất rõ rệt trong lĩnh vực này.
Google cho biết thành công này là nhờ vào mô hình ngôn ngữ PaLM 2, với việc bổ sung các ngôn ngữ như tiếng Afar, tiếng Quảng Đông, tiếng Manx, NKo, tiếng Punjabi, Tamazight và Tok Pisin.

Công ty cho biết họ đã thêm 110 ngôn ngữ mới để phục vụ cho hơn 614 triệu người nói, mở ra khả năng dịch cho khoảng 8% dân số toàn cầu.
Ngoài ra, một số trong số đó là những ngôn ngữ lớn trên thế giới với hơn 100 triệu người nói. Những ngôn ngữ khác được sử dụng bởi các cộng đồng dân tộc thiểu số, và một số ít gần như không còn người nói nhưng hiện đang được phục hồi.
Một phần ba trong số 110 ngôn ngữ mới đến từ Châu Phi, đây là bản cập nhật lớn nhất của Google Dịch cho khu vực này. Với 243 ngôn ngữ, số cặp dịch của Google Dịch hiện đã lên đến 29.403.
Mô hình PaLM 2 có những điểm gì đặc biệt?
PaLM viết tắt của Pathways Language Model (Mô hình ngôn ngữ Pathways), sử dụng kiến trúc Pathways AI của Google để đào tạo các mô hình học máy để thực hiện nhiều nhiệm vụ khác nhau. Đây là một phần quan trọng của tầm nhìn của Google trong việc đạt được AGI - trí tuệ nhân tạo tổng quát - mục tiêu là AI có thể thực hiện được mọi nhiệm vụ tư duy mà con người có thể làm.
Trước đó, Google đã tuyên bố rằng kiến trúc Pathways sẽ mở ra khả năng cho AI đa phương thức ngoài văn bản, và Gemini là một LLM khác đã đạt được mục tiêu này. Trong một bài đăng trên blog, công ty cho biết:
Pathways có thể kích hoạt các mô hình đa phương thức và hiểu biết về thị giác, thính giác và ngôn ngữ đồng thời. Do đó, dù mô hình đang xử lý từ 'con báo', âm thanh của ai đó nói 'con báo' hoặc video về một con báo đang chạy, thì phản ứng nhất quán sẽ được kích hoạt từ bên trong: ý tưởng về một con báo. Kết quả là một mô hình sâu sắc hơn và ít sai lầm hơn.
Khác với mô hình LaMDA mà nó thay thế, PaLM 2 đã được huấn luyện trên hơn 100 ngôn ngữ và có kiến thức sâu rộng trong các lĩnh vực như lập trình. Nó cũng có khả năng suy luận logic và toán học vượt trội.
Để cung cấp hỗ trợ cho Google Dịch, PaLM 2 được huấn luyện trên một lượng lớn văn bản đa ngôn ngữ đồng thời. Mô hình này có khả năng học và dịch các ngôn ngữ nhanh chóng nhờ vào logic mạnh mẽ, đặc biệt là các ngôn ngữ có mối liên hệ chặt chẽ như nhóm ngôn ngữ gần với tiếng Hindi.
Google đặt mục tiêu hỗ trợ 1.000 ngôn ngữ phổ biến nhất trên thế giới, nhằm giảm thiểu rào cản ngôn ngữ và thúc đẩy sự kết nối toàn cầu của cộng đồng.
