EnCodec: Công nghệ mã hóa sử dụng trí tuệ nhân tạo từ Meta hứa hẹn có khả năng nén tín hiệu âm thanh lên đến 10 lần so với định dạng MP3

Buzz

Các câu hỏi thường gặp

1.

EnCodec là gì và nó có những tính năng nổi bật nào?

EnCodec là thuật toán nén âm thanh mới được Meta giới thiệu, sử dụng trí tuệ nhân tạo với khả năng nén gấp 10 lần so với định dạng MP3. Nó duy trì chất lượng âm thanh ban đầu ở mức 64kbps, rất hữu ích cho việc truyền tải âm thanh trong các điều kiện băng thông thấp.
2.

Meta đã công bố EnCodec trong dự án nào và khi nào?

Meta đã chính thức giới thiệu EnCodec vào ngày 25/10 trong dự án nghiên cứu 'High Fidelity Neural Audio Compression'. Đội ngũ nghiên cứu AI của Meta bao gồm nhiều chuyên gia như Alexandre Défossez, Jade Copet, Gabriel Synnaeve và Yossi Adi đã phát triển thuật toán này.
3.

EnCodec hoạt động như thế nào để nén và giải nén âm thanh?

EnCodec hoạt động qua ba bước quan trọng: encoder mã hóa dữ liệu âm thanh chưa nén thành chuỗi dữ liệu tầng thấp, quantizer nén dữ liệu đến kích thước cố định, và decoder giải nén dữ liệu thành tín hiệu âm thanh sử dụng mạng thần kinh nhân tạo trên CPU.
4.

Thuật toán EnCodec có thể áp dụng trong những tình huống nào trong cuộc sống thực?

EnCodec có thể cải thiện chất lượng cuộc gọi trong những khu vực sóng yếu và giảm thiểu băng thông trong các trải nghiệm đa phương tiện, đặc biệt là trong Metaverse, nơi mà chất lượng âm thanh cao là rất quan trọng.