Seamless M4T, có thể hỗ trợ dịch giữa văn bản và lời nói ở gần 100 ngôn ngữ.
Meta, công ty mẹ của Facebook vừa thông báo về một mô hình AI mới có khả năng dịch và sao chép nội dung bằng lời nói hoặc văn bản trong hàng chục ngôn ngữ khác nhau. Mô hình AI này có thể trở thành cơ sở cho việc phát triển các công cụ giao tiếp thời gian thực mà không quan trọng ngôn ngữ.
Trong thông báo của mình, Meta đã cho biết mô hình AI Seamless M4T
Giám đốc điều hành của Meta, Mark Zuckerberg cho biết ông tưởng tượng ra các công cụ như thế này để tạo điều kiện thuận lợi cho sự tương tác giữa người dùng từ khắp nơi trên thế giới trong thế giới ảo, một chuỗi các thế giới ảo được kết nối với nhau mà ông đặt cược vào tương lai của công ty. Meta cung cấp mô hình này cho công chúng sử dụng mà không có mục đích thương mại.
Công ty truyền thông xã hội lớn nhất thế giới đã phát hành một số mô hình AI, hầu hết là miễn phí trong năm nay, bao gồm cả mô hình ngôn ngữ lớn có tên Llama, đặt ra thách thức nghiêm trọng đối với các mô hình độc quyền được bán bởi OpenAI do Microsoft hậu thuẫn và Google của Alphabet.
Zuckerberg cho biết hệ sinh thái AI mở là một lợi thế cho Meta, vì công ty có thể đạt được nhiều lợi ích hơn bằng cách thu thập các khoản đóng góp để xây dựng các công cụ tiêu dùng cho nền tảng xã hội của mình hơn là thu phí để truy cập vào các mô hình đó.
Tuy nhiên, Meta sẽ phải đối mặt với các câu hỏi pháp lý tương tự trong lĩnh vực AI liên quan đến dữ liệu đào tạo được sử dụng để xây dựng mô hình của mình.
Vào tháng 7, diễn viên hài Sarah Silverman và hai tác giả khác đã khởi kiện Meta và OpenAI về vi phạm bản quyền, cáo buộc rằng hai công ty này đã sử dụng sách của họ làm dữ liệu đào tạo mà không có sự cho phép.
Đối với Seamless M4T, các nhà nghiên cứu của Meta đã thu thập dữ liệu đào tạo âm thanh từ 4 triệu giờ 'âm thanh thô từ các nguồn công khai trên web'. Trong khi đó, dữ liệu văn bản được lấy từ một tập dữ liệu được tạo ra vào năm ngoái từ Wikipedia và các trang web tương tự.