"Đây là động cơ xe hơi miễn phí, giúp các bạn có thể chế tạo những chiếc xe mang thương hiệu của chính mình", Sarim Aziz, Giám đốc Chính sách công của Meta chia sẻ.

DỮ LIỆU TIẾNG VIỆT ĐÀO TẠO AI CHIẾM CHƯA TỚI 1%
Chương trình Thách thức Đổi mới Sáng tạo AISC 2025 (sự kiện quy tụ các tập đoàn công nghệ và bán dẫn hàng đầu thế giới) tập trung vào dự án ViGen, nhằm xây dựng bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để huấn luyện, đánh giá và cải thiện hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp AI hiểu sâu hơn về văn hóa, bối cảnh và cách diễn đạt tiếng Việt.
Dự án được kỳ vọng sẽ tăng cường sự hiện diện của tiếng Việt trong quá trình phát triển AI, đồng thời đóng góp vào sự phát triển của nền kinh tế số.

Ông Trần Việt Hùng - CEO ViGen.
Tại buổi họp báo công bố dự án ViGen trong khuôn khổ AISC 2025, ông Trần Việt Hùng (Người sáng lập mạng lưới STEAM For Vietnam, AI For Vietnam và CEO ViGen) đã chỉ ra thực tế rằng dữ liệu đào tạo tiếng Việt trong lĩnh vực AI chỉ chiếm 0,8% - một tỷ lệ rất nhỏ. Điều này khiến việc ứng dụng AI chưa đạt hiệu quả như mong đợi.
Nhận thức được thách thức này, tổ chức AI For Vietnam đã hợp tác cùng Tập đoàn Meta và Trung tâm Đổi mới Sáng tạo Quốc gia (NIC) để khởi động dự án ViGen.
Mục tiêu của dự án là giúp các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ cốt lõi, từ đó khai phá tiềm năng ứng dụng AI tại Việt Nam.
ViGen sẽ phát triển các bộ dữ liệu tiếng Việt mã nguồn mở với quy mô lớn và chất lượng cao nhằm huấn luyện và đánh giá hiệu quả của các mô hình AI.
Dự án ViGen cũng góp phần đảm bảo sự phát triển AI tại Việt Nam phù hợp với giá trị văn hóa và chuẩn mực đạo đức, hướng tới xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cảnh địa phương và có trách nhiệm.
CÁCH ĐỂ VIỆT NAM ĐỨNG TRÊN VAI NGƯỜI KHỔNG LỒ, TĂNG TỐC PHÁT TRIỂN AI.
Ông Sarim Aziz, Giám đốc Chính sách công tại Meta, chia sẻ rằng Tập đoàn Meta (chủ sở hữu Facebook) đang hỗ trợ Việt Nam toàn diện trong lĩnh vực phát triển AI. Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở, bao gồm thông tin chi tiết về di chuyển, kết nối xã hội, và dữ liệu đào tạo từ các bản đồ dân số được hỗ trợ bởi AI.
“ Đầu tiên, chúng tôi cung cấp cho các bạn mô hình AI mã nguồn mở Meta Llama. Điều này giống như một động cơ xe hơi, và chúng tôi cung cấp miễn phí để các bạn có thể xây dựng những chiếc xe của riêng mình. ViGen sẽ là nhiên liệu để vận hành động cơ đó ”.

Ông Sarim Aziz, Giám đốc Chính sách công tại Meta - Ảnh: Giáo dục Thời đại.
Đại diện Meta cho biết, tập đoàn này đang hỗ trợ Việt Nam giải quyết các vấn đề liên quan đến AI, từ công nghệ, kiến thức đến kinh tế. Mô hình Llama là minh chứng rõ ràng nhất. Hiện nay, tại Việt Nam, Llama đã được áp dụng để phát triển các trợ lý ảo tự động hóa việc truy xuất thông tin của Misa và trợ lý ảo pháp lý của Viettel. Đây là những ví dụ ban đầu cho thấy tiềm năng ứng dụng AI trong đời sống người Việt, đặc biệt là trong lĩnh vực công.
“Chúng tôi cũng hỗ trợ Việt Nam trong việc đào tạo và nâng cao nhận thức về AI với 900.000 học sinh đã được đào tạo, và chúng tôi đang nỗ lực mở rộng chương trình này ”.
Tuy nhiên, Giám đốc Chính sách công của Meta cũng nhấn mạnh rằng Việt Nam đang đối mặt với nhiều thách thức như thiếu nhân lực chất lượng cao, dữ liệu tiếng Việt đạt chuẩn, hạ tầng số, và sự ổn định của chính sách pháp lý. “ Đây chính là lý do chúng tôi cần sự hợp tác thêm từ Nvidia và Viettel… để giúp Việt Nam phát triển AI".
Ông Nguyễn Trường Thắng, Viện trưởng Viện Công nghệ Thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam chia sẻ: “ AI về bản chất giống như một đứa trẻ được các tập đoàn công nghệ tạo ra, và nó có khả năng học hỏi rất nhanh. Llama là sản phẩm của Meta, cho phép chúng ta tiếp cận và dạy nó kiến thức bằng tiếng Việt, và đó chính là mục tiêu mà dự án ViGen đang hướng tới".
Theo ông Thắng, khi các dự án như ViGen được triển khai hiệu quả, chúng ta sẽ tận dụng được AI mã nguồn mở, và đây chính là cách để Việt Nam đứng trên vai những người khổng lồ để tiến nhanh hơn.
Theo báo cáo của Deloitte, mô hình Llama đang được sử dụng rộng rãi tại nhiều quốc gia APAC như Việt Nam, Hàn Quốc, Singapore, Pakistan…
Meta hy vọng trong thời gian tới sẽ tiếp tục mở rộng hợp tác với các công ty công nghệ Việt Nam để thúc đẩy phát triển AI theo hướng mã nguồn mở. “ Thông qua các chương trình hợp tác, chúng ta có thể khai phá tối đa tiềm năng của công nghệ số và xây dựng một tương lai tươi sáng hơn ”, đại diện Meta chia sẻ.
