EnCodec: Công nghệ mã hóa sử dụng trí tuệ nhân tạo từ Meta hứa hẹn có khả năng nén tín hiệu âm thanh lên đến 10 lần so với định dạng MP3

Buzz

Ngày cập nhật gần nhất: 15/7/2026

Đọc tóm tắt

- Meta giới thiệu EnCodec, thuật toán nén âm thanh mới sử dụng trí tuệ nhân tạo, nén gấp 10 lần so với MP3, duy trì chất lượng ban đầu.
- EnCodec giúp cải thiện truyền tải âm thanh trong điều kiện băng thông thấp, áp dụng cho cuộc gọi điện thoại và kết nối mạng yếu.
- Meta giới thiệu EnCodec trong dự án 'High Fidelity Neural Audio Compression' vào ngày 25/10.
- EnCodec sử dụng mạng lưới thần kinh nhân tạo để nén và giải nén âm thanh stereo 48kHz.
- Ứng dụng thực tế của EnCodec hứa hẹn cải thiện chất lượng cuộc gọi và trải nghiệm đa phương tiện trong Metaverse.

Trong tuần vừa qua, Meta đã chính thức giới thiệu EnCodec - một thuật toán nén âm thanh mới sử dụng trí tuệ nhân tạo, với khả năng nén gấp 10 lần so với định dạng MP3. EnCodec không chỉ có thể nén âm thanh ở chất lượng 64kbps mà còn duy trì chất lượng ban đầu, giúp cải thiện truyền tải trong các điều kiện có băng thông thấp, như trong cuộc gọi điện thoại hoặc kết nối mạng yếu. Công nghệ này cũng có thể áp dụng để nén các file nhạc.Thuật toán EnCodec đã được Meta giới thiệu chính thức vào ngày 25/10 trong dự án nghiên cứu về nén âm thanh chất lượng cao mang tên 'High Fidelity Neural Audio Compression' của đội ngũ nghiên cứu AI của Meta, gồm có Alexandre Défossez, Jade Copet, Gabriel Synnaeve và Yossi Adi. Meta cũng đã đăng một bài blog để chia sẻ thêm thông tin chi tiết về EnCodec.

Meta thông báo rằng EnCodec đặc biệt là một hệ thống trí tuệ nhân tạo với ba bước quan trọng: encoder (mã hóa), quantizer (nén), và decoder (giải mã), được đào tạo để nén âm thanh về kích thước cố định. Các bước bao gồm:

Encoder chuyển đổi dữ liệu chưa nén thành chuỗi dữ liệu tầng thấp để chuẩn bị xử lý

Quantizer nén chuỗi dữ liệu tầng thấp đến kích thước quy định và tập trung vào các thành phần quan trọng (đối với quy trình giải nén)

Decoder giải nén dữ liệu thành tín hiệu âm thanh trong thời gian thực, sử dụng mạng thần kinh nhân tạo trên CPU.

Thuật toán này sử dụng mạng lưới thần kinh nhân tạo để nén và giải nén âm thanh, đặc biệt là âm thanh stereo 48kHz (cao hơn chút so với chất lượng CD là 44.1 kHz) - chất lượng phổ biến trên các dịch vụ stream nhạc hiện nay. Mặc dù ý tưởng áp dụng mạng lưới thần kinh nhân tạo không mới, nhóm nghiên cứu của Meta tự hào là những người đầu tiên áp dụng công nghệ này cho lĩnh vực âm thanh.Ứng dụng thực tế của thuật toán 'siêu nén âm thanh' của Meta, sử dụng trí tuệ nhân tạo, hứa hẹn cải thiện chất lượng cuộc gọi ở những khu vực sóng yếu, tạo ra trải nghiệm trơn tru hơn cho người dùng. Ngoài ra, Meta cho biết EnCoder sẽ sớm áp dụng vào Metaverse, nâng cao trải nghiệm đa phương tiện mà không tốn quá nhiều băng thông.EnCoder hiện đang ở giai đoạn nghiên cứu và phát triển.Nguồn thông tin từ arstechnica

Các câu hỏi thường gặp

EnCodec là gì và nó có những tính năng nổi bật nào?

EnCodec là thuật toán nén âm thanh mới được Meta giới thiệu, sử dụng trí tuệ nhân tạo với khả năng nén gấp 10 lần so với định dạng MP3. Nó duy trì chất lượng âm thanh ban đầu ở mức 64kbps, rất hữu ích cho việc truyền tải âm thanh trong các điều kiện băng thông thấp.

Meta đã công bố EnCodec trong dự án nào và khi nào?

Meta đã chính thức giới thiệu EnCodec vào ngày 25/10 trong dự án nghiên cứu 'High Fidelity Neural Audio Compression'. Đội ngũ nghiên cứu AI của Meta bao gồm nhiều chuyên gia như Alexandre Défossez, Jade Copet, Gabriel Synnaeve và Yossi Adi đã phát triển thuật toán này.

EnCodec hoạt động như thế nào để nén và giải nén âm thanh?

EnCodec hoạt động qua ba bước quan trọng: encoder mã hóa dữ liệu âm thanh chưa nén thành chuỗi dữ liệu tầng thấp, quantizer nén dữ liệu đến kích thước cố định, và decoder giải nén dữ liệu thành tín hiệu âm thanh sử dụng mạng thần kinh nhân tạo trên CPU.

Thuật toán EnCodec có thể áp dụng trong những tình huống nào trong cuộc sống thực?

EnCodec có thể cải thiện chất lượng cuộc gọi trong những khu vực sóng yếu và giảm thiểu băng thông trong các trải nghiệm đa phương tiện, đặc biệt là trong Metaverse, nơi mà chất lượng âm thanh cao là rất quan trọng.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]