AI tạo sinh (Generative AI) là một loại Trí tuệ nhân tạo có khả năng tạo ra nội dung và ý tưởng mới trong nhiều hình thức khác nhau (văn bản, hình ảnh, âm thanh...). Các ứng dụng của AI tạo sinh có thể tạo ra kết quả tương đương như khi được tạo ra bởi con người. Ngoài khả năng sáng tạo nội dung, AI tạo sinh cũng được sử dụng để cải thiện chất lượng hình ảnh kỹ thuật số, tạo ra các mẫu cho quá trình sản xuất và nhiều khả năng khác.
Mô hình ngôn ngữ lớn (LLM) là một mô hình được huấn luyện bằng cách sử dụng các phương pháp học sâu trên tập dữ liệu văn bản hoặc hình ảnh lớn. Mô hình này có khả năng hiểu tri thức, tạo ra văn bản tự nhiên và thực hiện các tác vụ xử lý ngôn ngữ tự nhiên khác nhau. Đây được coi là chìa khóa để phát triển công nghệ AI tạo sinh (Generative AI) - công nghệ đứng sau thành công của các giải pháp đột phá như ChatGPT.
Việc hoàn toàn làm chủ công nghệ, tự phát triển từ những bước ban đầu, xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt, được xem là một bước tiến quan trọng giúp VinBigdata đưa công nghệ AI tạo sinh vào hệ sinh thái sản phẩm và dịch vụ đã và đang cung cấp ra thị trường.
Theo đó, VinBigdata sẽ tích hợp công nghệ để biến VinBase (nền tảng trí tuệ nhân tạo đa nhận thức toàn diện) trở thành nền tảng AI tạo sinh đầu tiên tại Việt Nam, đồng thời cung cấp các giải pháp phát triển trên nền công nghệ AI tạo sinh như Generative AI chatbot, callbot hay Trợ lý ảo ViVi thế hệ mới… Công nghệ này sẽ giúp cải thiện tính tự nhiên trong giao tiếp của máy, đồng thời hỗ trợ người dùng tìm kiếm, tổng hợp thông tin một cách nhanh chóng và đơn giản hơn rất nhiều so với trước đây.
Giáo sư Vũ Hà Văn, Giám đốc Khoa học Công ty VinBigdata (Tập đoàn Vingroup) chia sẻ:“Trên thế giới đã có một số tập đoàn lớn nghiên cứu thành công và ra mắt các sản phẩm dựa trên mô hình ngôn ngữ lớn như OpenAI với ChatGPT hay Google với Bard. Tại Việt Nam, nhận được sự đầu tư mạnh mẽ từ Tập đoàn Vingroup, VinBigdata đã xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt, tập trung giải quyết ba vấn đề cốt lõi: cải thiện tính chính xác, giảm chi phí hạ tầng tính toán một cách tối đa và đảm bảo tính bảo mật. Thay vì cần tới khoảng 175 tỷ tham số như ChatGPT thì VinBigdata có thể tạo ra mô hình ngôn ngữ lớn với vài tỷ tham số nhưng vẫn có khả năng sinh ra các văn bản có tính xác thực cao, tập trung vào dữ liệu của người Việt và tri thức Việt”.
Hiện VinBigdata đã bắt đầu áp dụng thành công công nghệ mới trên dòng sản phẩm VinBase KB (VinBase Knowledge Base Portal). Sản phẩm có khả năng truy xuất thông tin và tự động tạo ra câu trả lời dựa trên các thông tin thu thập từ các tập dữ liệu cực lớn trong hệ tri thức.
Trong kế hoạch phát triển hệ sinh thái các sản phẩm ứng dụng AI tạo sinh quy mô lớn, dự kiến vào cuối tháng 12/2023, VinBigdata sẽ chính thức giới thiệu cộng đồng hai dòng sản phẩm chính. Đó là Nền tảng AI tạo sinh đa nhận thức VinBase 2.0 với các giải pháp dành cho doanh nghiệp, cơ quan chính phủ và ứng dụng ViGPT – “ChatGPT phiên bản tiếng Việt” sẽ được mở cho cộng đồng truy cập và thử nghiệm. Với ViGPT, người dùng có thể đặt câu hỏi về thông tin cụ thể của Việt Nam (quy định, văn bản pháp luật), hoặc các thông tin địa phương (lịch sử, văn hóa, danh lam thắng cảnh, đặc sản địa phương…).
Trở thành đơn vị đầu tiên tại Việt Nam hoàn thiện mô hình ngôn ngữ lớn tiếng Việt, VinBigdata đang đóng góp tích cực vào sự phát triển của các ngành khoa học công nghệ của Việt Nam và cạnh tranh một cách công bằng với các công ty công nghệ toàn cầu.