Mô hình này dự kiến sẽ được phát hành trong nửa đầu năm 2026.

Meta đang phát triển một mô hình AI có tên Mango, tập trung vào hình ảnh và video, cùng lúc với việc xây dựng mô hình xử lý ngôn ngữ quy mô lớn dựa trên văn bản.
Theo thông tin từ những người tham gia buổi hỏi đáp gần đây của công ty, giám đốc AI Alexandr Wang đã cùng Chris Cox, giám đốc sản phẩm của Meta, thảo luận về các mô hình AI. Những mô hình này dự kiến sẽ được ra mắt vào nửa đầu năm 2026.
Theo Reuters, Mango không chỉ là mô hình tạo ảnh hay video, mà còn tập trung vào việc kết nối ngữ cảnh giữa hình ảnh, chuyển động, âm thanh và văn bản, giúp AI 'hiểu' video theo cách gần giống con người. Điều này đặc biệt quan trọng đối với Meta, khi phần lớn thời gian người dùng dành trên Facebook và Instagram hiện nay là từ video ngắn, Reels và các định dạng thị giác. Việc kiểm soát mô hình AI chuyên về video giúp Meta tối ưu hóa thuật toán đề xuất, sáng tạo nội dung và quảng cáo – ba yếu tố quyết định doanh thu của công ty.
Wang cũng chia sẻ rằng một trong những mục tiêu chính của mô hình văn bản mới, mang tên Avocado, là cải thiện khả năng lập trình. Công ty hiện đang trong giai đoạn đầu nghiên cứu phát triển 'mô hình thế giới' – trí tuệ nhân tạo học hỏi từ môi trường xung quanh qua việc tiếp nhận thông tin hình ảnh.
Vào mùa hè vừa qua, Meta đã tái cấu trúc đội ngũ AI của mình, mời Wang lãnh đạo bộ phận mới mang tên Meta Superintelligence Labs. CEO Mark Zuckerberg đã đích thân dẫn đầu chiến dịch tuyển dụng, thu hút hơn 20 nhà nghiên cứu từ OpenAI và xây dựng một đội ngũ hơn 50 chuyên gia, kỹ sư và nhân viên có chuyên môn về AI.
Việc tạo ra hình ảnh đã trở thành một mặt trận quan trọng trong cuộc cạnh tranh giữa các công ty công nghệ AI hàng đầu.
Vào tháng 9, Meta đã ra mắt Vibes, một công cụ tạo video bằng AI được phát triển cùng với công ty khởi nghiệp Midjourney. Chỉ trong vòng một tuần sau khi Vibes được phát hành, OpenAI đã tung ra ứng dụng tạo video AI của riêng mình mang tên Sora. Hơn nữa, việc Google giới thiệu công cụ tạo ảnh Nano Banana vào đầu năm nay đã thúc đẩy mạnh mẽ sự phát triển của Gemini, làm tăng cường sự cạnh tranh trong một thị trường đã quá đông đúc.
Mango không chỉ phục vụ cho các sản phẩm nội bộ mà còn là chiến lược cạnh tranh trực diện của Meta với OpenAI, Google và các startup AI mới nổi. Theo Reuters, các nhà phân tích nhận định rằng AI video có thể sẽ là mặt trận cạnh tranh tiếp theo, nơi các công ty công nghệ lớn sẽ tìm cách kiểm soát các công cụ sáng tạo nội dung, quảng cáo và giải trí trong tương lai. Với kho dữ liệu hình ảnh và video khổng lồ từ các mạng xã hội, Meta có lợi thế đặc biệt trong việc huấn luyện các mô hình như Mango.
Tuy nhiên, con đường phía trước không thiếu thách thức. Meta vẫn phải đối mặt với chi phí lớn và những câu hỏi pháp lý liên quan đến bản quyền dữ liệu hình ảnh và video được sử dụng để huấn luyện AI. Thêm vào đó, việc triển khai AI mạnh mẽ hơn vào các nền tảng xã hội cũng gây lo ngại về các vấn đề như deepfake, thao túng thông tin và an toàn nội dung, những vấn đề mà Meta đã phải hứng chịu nhiều chỉ trích trước đây.
Theo: WSJ
