Mô hình EXAONE 3.0 của LG đánh dấu sự gia nhập của Hàn Quốc vào cộng đồng AI toàn cầu.
LG AI Research vừa giới thiệu mô hình AI mã nguồn mở đầu tiên của Hàn Quốc, EXAONE 3.0. Điều này đánh dấu bước vào thị trường AI toàn cầu của Hàn Quốc, nơi hiện đang được các công ty công nghệ Mỹ và các công ty mới nổi ở Trung Quốc và Trung Đông chi phối. Hiện tại, mô hình chỉ hỗ trợ hai ngôn ngữ: tiếng Anh và tiếng Hàn.
EXAONE 3.0 là một mô hình mã nguồn mở, được xây dựng dựa trên kiến trúc Transformer với bộ giải mã duy nhất. Mô hình này có 7.8 tỷ tham số và được đào tạo trên 8 tỷ token.
LG cho biết: 'Mô hình EXAONE 3.0 với 7.8 tỷ tham số được mở nguồn để phục vụ nghiên cứu, với mục đích hỗ trợ các nhà nghiên cứu trong và ngoài nước tiến hành các nghiên cứu có giá trị hơn và thúc đẩy sự phát triển của hệ sinh thái AI'. Công ty kỳ vọng việc phát hành mô hình này sẽ mang lại lợi ích lớn cho cộng đồng nghiên cứu AI.
Theo đánh giá của công ty, khả năng tiếng Anh của mô hình đạt đến 'mức cao nhất thế giới'. Điểm số trung bình của các bài kiểm tra thực tế đứng đầu, vượt qua các mô hình như Llama 3.0.
Về khả năng toán học và lập trình, EXAONE 3.0 cũng nổi bật với điểm số trung bình cao và khả năng lập luận mạnh mẽ.
EXAONE 3.0 không chỉ dẫn đầu về điểm số trung bình cho cả ứng dụng thực tế lẫn điểm chuẩn tại Hàn Quốc, mà còn giảm thời gian suy luận 56%, tiêu thụ bộ nhớ 35%, và chi phí vận hành 72% so với thế hệ trước.
Mô hình mới nhất đã được đào tạo trên 60 triệu dữ liệu chuyên ngành liên quan đến bằng sáng chế, mã nguồn, toán học và hóa học. Công ty dự kiến mở rộng lượng dữ liệu đào tạo lên 100 triệu trường hợp trong các lĩnh vực khác vào cuối năm nay.
Để giảm tiêu thụ điện khi vận hành mô hình AI, LG AI Research đã tập trung vào việc tối ưu hóa công nghệ và giảm kích thước mô hình. Họ đã thành công trong việc giảm kích thước mô hình xuống 97% và nâng cao hiệu suất so với EXAONE 1.0.
Bình Minh