- Zalo AI Summit 2023 là sự kiện được cộng đồng AI mong đợi, quy tụ nhiều chuyên gia Việt hàng đầu trong lĩnh vực AI.
- Diễn ra tại VNG Campus, Quận 7, TP.HCM, bắt đầu chính thức vào lúc 8h45.
- Ông Nguyễn Minh Tú, Giám đốc Công nghệ Zalo, khai mạc và chia sẻ thông tin tổng quan về trí tuệ nhân tạo tại Việt Nam.
- Các mô hình AI Tạo Sinh đã được áp dụng rộng rãi trong cuộc sống và các lĩnh vực như âm nhạc, nghệ thuật, công nghệ.
- Xu hướng hiện nay là xây dựng các mô hình đa năng và các mô hình từ nhỏ đến lớn đều đang được phát triển cùng nhau.
- Zalo Summit 2023 là sự kiện thường niên được tổ chức lần thứ 7, với chủ đề chính xoay quanh Trí Tuệ Tạo Sinh.
- Cuộc thi ZaloAI Summit 2023 đã thu hút sự quan tâm của gần 1.000 đội thi tham gia tranh tài ở cả 3 phần thi với chủ đề Generative AI.
- Sức lan tỏa của trí tuệ nhân tạo ChatGPT có thể xem là hiện tượng lớn nhất trong cuộc sống con người.
- Các mô hình LLM hoạt động dựa trên 3 kiểu suy luận chính và mặc dù có hạn chế, chúng vẫn tiếp tục phát triển.
- ZaloAI hợp tác với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản để giới thiệu bộ đánh giá VMLU nhằm đánh giá khả năng hiểu và sử dụng ngôn ngữ tiếng Việt của các mô hình AI.
Zalo AI Summit 2023 là sự kiện được cộng đồng AI mong đợi, quy tụ nhiều chuyên gia Việt hàng đầu trong lĩnh vực AI. Diễn ra tại VNG Campus, Quận 7, TP.HCM.
Bắt đầu chính thức vào lúc 8h45.
Ông Nguyễn Minh Tú, Giám đốc Công nghệ Zalo, khai mạc và chia sẻ thông tin tổng quan về trí tuệ nhân tạo tại Việt Nam. Các mô hình AI Tạo Sinh đã được áp dụng rộng rãi trong cuộc sống và các lĩnh vực như âm nhạc, nghệ thuật, công nghệ...
Nhiều công ty công nghệ giới thiệu các công cụ Trí Tuệ Tạo Sinh. Xu hướng hiện nay là xây dựng các mô hình đa năng. Đồng thời, các mô hình từ nhỏ đến lớn đều đang được phát triển cùng nhau.
Zalo Summit 2023 là sự kiện thường niên được tổ chức lần thứ 7, với chủ đề chính xoay quanh Trí Tuệ Tạo Sinh.
Cuộc thi ZaloAI Summit 2023 đã thu hút sự quan tâm của gần 1.000 đội thi tham gia tranh tài ở cả 3 phần thi với chủ đề Generative AI.
Giáo sư Trần Thanh Long chia sẻ về triển vọng của Trí Tuệ Nhân Tạo.
Sức lan tỏa của trí tuệ nhân tạo ChatGPT có thể xem là hiện tượng lớn nhất trong cuộc sống con người. Chỉ trong 2 tháng, đã có 100 triệu người dùng, một thành công ngoạn mục.
Sự phát triển của Trí Tuệ Nhân Tạo dựa vào các mô hình ngôn ngữ lớn (LLM) mang tính ứng dụng rộng lớn. Chúng ta đã từng dần tiến xa trong việc áp dụng các phương pháp này vào thực tiễn. Hiện nay, các mô hình LLM đã có sức mạnh đáng kinh ngạc để giải quyết nhiều bài toán khác nhau.
Tuy nhiên, mặc dù có những hạn chế, các mô hình LLM vẫn tiếp tục phát triển. Chúng là sản phẩm của sự đơn giản và mạnh mẽ của các thuật toán được nghiên cứu và phát triển bởi các chuyên gia.
Các mô hình LLM hoạt động dựa trên 3 kiểu suy luận chính như được minh họa. Mặc dù hiện nay các công cụ như Chat GPT đang thể hiện sự động viên, nhưng trong tương lai, chúng có thể trở nên tự chủ hơn trong việc tương tác với các LLM khác hoặc người dùng.
Muốn tham gia và trải nghiệm ngay, anh em có thể tải về các mô hình Trí Tuệ Nhân Tạo ngay trên thiết bị của mình. LLM có nhiều ứng dụng đa dạng, từ những ứng dụng thực tiễn như điều khiển nhà thông minh.
Một ứng dụng tiềm năng khác là xây dựng một thành phố thông minh bằng cách kết hợp nhiều Đại Sứ LLM cùng lúc. Chúng có thể điều khiển hệ thống giao thông hoặc ánh sáng đường phố,... Nhưng vẫn còn nhiều thách thức cần vượt qua để thực hiện ý tưởng này.
Từ năm 2016, Microsoft đã bắt đầu phát triển mô hình Trí Tuệ Nhân Tạo có tên là Tay.ai, nhưng đã đóng cửa trong vòng một ngày. Chatbot này được thiết kế để hoạt động trên Twitter như một cô gái 14 tuổi, nhưng đã bị đưa vào thông tin phân biệt chủng tộc, làm cho ý tưởng này hoàn toàn thất bại. Do đó, việc bảo mật là rất quan trọng trong quá trình phát triển hệ thống.
Một thách thức quan trọng của LLM là khả năng tương tác. Melting Pot là nơi mà anh em có thể thử nghiệm mô hình của mình để kiểm tra hiệu quả trong tương tác.
Sự kiện Flash Crash đã làm mất hàng nghìn tỷ USD trong vài giây đồng hồ cho nền kinh tế Mỹ. Nguyên nhân là do các hệ thống AI không tương tác hiệu quả với nhau.
LLM sẽ thống trị nhiều lĩnh vực trong cuộc sống và LLM Agents sẽ trở thành một phần không thể thiếu. Tuy nhiên, việc đạt được điều đó vẫn còn là một chặng đường dài.
Tiến sĩ Nguyễn Trường Sơn, giám đốc Khoa học của Zalo AI đang trình bày phần nội dung của mình trên sân khấu. Tại Việt Nam, việc xây dựng các mô hình ngôn ngữ nhỏ hơn vẫn đang trong quá trình phát triển mạnh mẽ.
Bàn phím mà anh em đang sử dụng đã tích hợp khả năng dự đoán văn bản, là một loại mô hình ngôn ngữ, được huấn luyện từ dữ liệu chat hàng ngày để phát triển. Tuy nhiên, các mô hình này chỉ dự đoán được một số từ tương đối nhỏ.
Khả năng dự đoán của mô hình ngôn ngữ tăng cao khi có nhiều ngữ cảnh hơn. Các mô hình ngôn ngữ đa dạng, từ nhỏ đến lớn, có chi phí và lượng dữ liệu đầu tư khác nhau. Hiện tại, đa số các mô hình này hoạt động bằng tiếng Anh, với số lượng ít đáng kể sử dụng tiếng Việt.
Mô hình ngôn ngữ LLM trở nên cần thiết vì hầu hết các hoạt động hàng ngày như trò chuyện cũng tuân theo việc 'dự đoán từ tiếp theo'. Khi các mô hình ngôn ngữ trở nên phổ biến, chúng cũng được sử dụng cho mục đích gian lận, ví dụ như sinh viên sử dụng để viết luận văn. Tuy nhiên, AI cũng mang lại nhiều lợi ích kinh tế cùng với những rủi ro đi kèm.
Các mô hình ngôn ngữ có thể được tích hợp dưới dạng API để phát triển các công cụ đáp ứng các nhu cầu cụ thể hơn, như viết CV chẳng hạn.
Thực tế, mô hình ngôn ngữ đã có một lịch sử phát triển dài lâu, từ nhiều công ty công nghệ và tổ chức khác nhau. Tuy nhiên, ở Việt Nam, vẫn chưa có tổ chức nào thực hiện được điều này.
Việc xây dựng một mô hình ngôn ngữ cho tiếng Việt là cần thiết, tuy sẽ gặp phải nhiều thách thức. Sử dụng các công cụ hiện tại như GPT3/4 có thể tiềm ẩn rủi ro rò rỉ thông tin, đặc biệt là với các tổ chức và doanh nghiệp. Hiện nay, việc sử dụng GPT3/4 để thực hiện các nhiệm vụ bằng tiếng Việt vẫn chưa được tối ưu cho người Việt. Ngoài ra, chi phí cũng là một vấn đề cần xem xét, cùng với bảo mật thông tin và khả năng tùy chỉnh công cụ.
Để biểu diễn một từ trong tiếng Việt cần khoảng 2,4 token, so với 1,1 token của tiếng Anh. Do đó, chi phí phát triển mô hình ngôn ngữ cho tiếng Việt cũng sẽ cao hơn. Thời gian để có kết quả cũng sẽ chậm hơn do không được tối ưu cho tiếng Việt. OpenAI tính phí theo token, vì vậy đây cũng là một vấn đề cần quan tâm bên cạnh vấn đề bảo mật và khả năng tùy chỉnh.
Dữ liệu tiếng Anh có sẵn khá phong phú từ nhiều nguồn khác nhau, trong khi đối với tiếng Việt lại khá hạn chế. Điều này tạo ra một rào cản lớn trong việc phát triển các mô hình ngôn ngữ dựa trên tiếng Việt. Vấn đề về phần cứng cũng là một thách thức song song, đặc biệt là với việc cung cấp GPU cho việc phát triển mô hình ngôn ngữ.
Dòng chảy phát triển các mô hình ngôn ngữ tại Việt Nam đang lan tỏa từ nhiều cá nhân và tổ chức khác nhau, một dấu hiệu tích cực.
Chính phủ cũng đang hỗ trợ sự phát triển của các mô hình ngôn ngữ lớn. Zalo cũng đang tiến hành phát triển mô hình ngôn ngữ riêng của họ, đòi hỏi nhiều bước từ quá trình tiền huấn luyện đến việc dạy cho mô hình biết 'nói chuyện' để có khả năng đối đáp tốt hơn.
Zalo đang tổng hợp khoảng 650GB dữ liệu từ nhiều nguồn khác nhau để xây dựng mô hình ngôn ngữ. Họ cũng sở hữu vài trăm nghìn cấu trúc để huấn luyện các mô hình này.
Việc tạo ra 1 từ bằng công cụ này yêu cầu khoảng 1,1 đến 1,2 token, mức độ này cũng khá tốt cho cả tiếng Anh và tiếng Việt, hứa hẹn giảm chi phí và thời gian xuất kết quả.
Về mặt kiến trúc và kích thước, Zalo sẽ sử dụng một số kiến trúc từ Nemo và Llama - những công cụ đã có sẵn và hoạt động rất tốt. GPU H100 sẽ được chọn để vận hành các mô hình kỹ thuật này. Kết quả benchmark đầu tiên cho thấy Zalo đạt hiệu quả tốt trong quá trình huấn luyện.
So sánh với các mô hình khác dựa trên cùng một nhiệm vụ, mô hình của Zalo hiện đang hoạt động tốt với các tác vụ tiếng Việt.
Với khả năng viết email và khả năng dịch. Bên cạnh đó, công cụ này còn có khả năng rút trích thông tin thông minh, như địa điểm hoặc số liệu. Anh em có thể sử dụng mô hình này để phát triển các chatbot thực hiện các nhiệm vụ tìm kiếm dữ liệu cho công ty.
Bước tiếp theo là cải thiện khả năng suy luận bằng nhiều mô hình khác nhau. Mục tiêu của Zalo là xây dựng một mô hình có 5TB văn bản như các mô hình lớn khác trên thế giới. Mô hình này cũng được định hình để có thể hiểu nhiều loại đầu vào khác nhau, từ văn bản đến hình ảnh hoặc video.
Kỹ sư Khang Mạnh Tứ, trưởng nhóm phát triển hệ thống tại Zalo, chia sẻ về việc xây dựng phần cứng để tạo ra mô hình ngôn ngữ. Ví dụ, trợ lý ảo Kiki - một mô hình trợ lý giọng nói được công ty phát triển.
Mục tiêu về độ trễ là 500ms từ khi nhận dạng giọng nói đến khi trả kết quả. Đối với ứng dụng này, Zalo đã xây dựng một mô hình để thử nghiệm trên RTX 3090 và thấy kết quả khá hợp lý, nhưng chi phí quá cao. Một mô hình khác đã được thử nghiệm trên GPU A5500. Cuối cùng, GPU RTX 4090 đã được chọn để chạy mô hình này để tối ưu hiệu suất.
Zalo cũng sử dụng LLM để tạo ra mô hình AI làm thơ, với mục tiêu độ trễ cho phép là 1 giây. GPU 3090 và 3049 đều hoạt động tốt, nhưng GPU 3090 đã được chọn để tối ưu chi phí. Do đó, việc chọn phần cứng phù hợp với mỗi nhiệm vụ mà bạn muốn mô hình ngôn ngữ thực hiện là rất quan trọng.
Hỏng hóc phần cứng cũng là vấn đề mà chúng ta cần đối mặt, vì vậy việc xây dựng các cơ chế để phát hiện và khắc phục sự cố kịp thời là điều hoàn toàn cần thiết. GPU RTX 4090 hiện đang gặp vấn đề về quá nhiệt, vì vậy giải pháp là giảm số lượng phần cứng trên mỗi máy chủ. Zalo cũng đang đầu tư vào các dòng GPU mới như H100 để sử dụng cho việc huấn luyện mô hình ngôn ngữ.
Anh Cuhiep Trần, quản trị Mytour.vn, đã xuất hiện trên sân khấu để tổ chức một phiên hỏi đáp thú vị về ngôn ngữ, một lĩnh vực mà trí tuệ nhân tạo đang dần khám phá.
Trong “cuộc thi” này, chúng ta đã chứng kiến sự đối đầu giữa các trợ lý ảo khác nhau, bao gồm cả Kiki của Zalo và một con người, Mod Vân. Kết quả cho thấy Vân đứng đầu, Kiki đứng ở vị trí thứ ba. Điều này cho thấy mặc dù tốc độ xử lý của các trợ lý ảo AI rất nhanh, nhưng tiếng Việt vẫn còn nhiều hạn chế và cần phải được phát triển và huấn luyện để hoàn thiện hơn mỗi ngày.
Tiến sĩ Ettikan Kandasamy Karuppiah, Giám đốc Công nghệ của Nvidia khu vực Châu Á - Thái Bình Dương, đã chia sẻ về triển vọng của trí tuệ nhân tạo trong giai đoạn từ 2023 đến 2024.
Các giai đoạn phát triển của trí tuệ nhân tạo.
NeVa (NeMo Vision and Language Assistant), một trợ lý ngôn ngữ đa phương tiện của Nvidia, có khả năng hiểu văn bản và hình ảnh, đồng thời cung cấp các phản hồi thông tin. Nó được xây dựng dựa trên nền tảng NeMo của Nvidia, là một bộ công cụ mã nguồn mở để phát triển và triển khai các mô hình trí tuệ nhân tạo đa phương tiện.
Một số ví dụ được thực hiện để minh họa khả năng xử lý của trợ lý trí tuệ nhân tạo trong việc thảo luận, giải đáp thắc mắc và đưa ra gợi ý cho người sử dụng. Ví dụ, bạn có thể gửi cho trợ lý trí tuệ nhân tạo một bức ảnh về bánh xe bị xẹp, và AI sẽ quét hình ảnh và đề xuất cách xử lý tình huống.
NVIDIA NeMo, một phần của nền tảng NVIDIA AI, là một framework phát triển ứng dụng AI toàn diện cấp doanh nghiệp, cloud-native, xây dựng có mục đích cho việc tùy biến và triển khai các mô hình AI tạo sinh (Generative AI) với hàng tỷ tham số. NeMo giúp việc phát triển mô hình AI tạo sinh trở nên dễ dàng, tiết kiệm chi phí và nhanh chóng cho các doanh nghiệp.
Giáo sư Nguyễn Lê Minh chia sẻ về bộ đánh giá cho các mô hình ngôn ngữ lớn.
Hình ảnh của mô hình ngôn ngữ LLMs trên thế giới. Có 15,821 LLMs đã được ra mắt từ 18/7/2023.
Có nhiều phương pháp để đánh giá hiệu suất của một mô hình AI
ZaloAI hợp tác với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) để giới thiệu bộ đánh giá VMLU (Vietnamese Multitask Language Understanding) nhằm đánh giá khả năng hiểu và sử dụng ngôn ngữ tiếng Việt của các mô hình AI. VMLU được hy vọng sẽ trở thành tiêu chuẩn đánh giá tiếng Việt cho các nhóm nghiên cứu AI, giúp đánh giá hiệu suất của các mô hình đang phát triển.
VMLU là bộ tiêu chuẩn đánh giá tiếng Việt với 10.880 câu hỏi trắc nghiệm về 58 chủ đề khác nhau.
Thách thức Zalo AI 2023 tập trung vào 3 đề bài khác nhau, các đội cần phải huấn luyện mô hình để giải quyết. Mỗi đề bài sẽ có một đội chiến thắng.
Giải Toán Tiểu Học - Các đội thi phải xây dựng mô hình AI để giải các bài toán tiểu học theo chuẩn chương trình giáo dục Việt Nam.
=> Đội NguyenLe đã đoạt vị trí đầu tiên
Tạo Banner Quảng Cáo - Các đội thi sử dụng mô hình AI để tự động thiết kế các banner quảng cáo dựa trên thông tin mô tả cung cấp.
=> Đội T-Sharp đã đoạt vị trí đầu tiên
Tạo Nhạc Nền - Các đội thi sử dụng mô hình AI để tạo ra các đoạn nhạc nền dựa trên yêu cầu về giai điệu, nhạc cụ và thể loại nhạc.
=> Đội Berlin đã đoạt vị trí đầu tiên
Trao giải TOP 15 với những phần thưởng từ nhà tài trợ Intel.
Trao giải Á quân cho 3 đội đạt giải ở 3 bộ đề được tổ chức đưa ra.
Các đội vô địch từng bộ đề sẽ nhận giải Nhất.
Kỹ sư của ZaloAI sẽ được trao giải thưởng trong vòng đấu nội bộ.
Ban tổ chức ZaloAI Summit sẽ tặng hoa và quà tri ân cho giáo sư, kỹ sư, diễn giả, và ban cố vấn đã đồng hành.
Ban tổ chức ZaloAI Summit trao hoa và quà tri ân đến các đối tác và nhà tài trợ.
Kết thúc ZaloAI Summit 2023 và công bố kết quả của Zalo AI Challenge 2023.
2
Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.
Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua email: [email protected]
Trang thông tin điện tử nội bộ
Công ty cổ phần du lịch Việt Nam VNTravelĐịa chỉ: Tầng 20, Tòa A, HUD Tower, 37 Lê Văn Lương, Quận Thanh Xuân, Thành phố Hà NộiChịu trách nhiệm quản lý nội dung: 0965271393 - Email: [email protected]