Âm thanh 32-bit Float là gì và liệu bạn có nên sử dụng nó khi ghi âm?

Khác với công nghệ video, mà dường như thay đổi mỗi 10 năm một lần, âm thanh đã giữ nguyên khá lâu trong nhiều thập kỷ. Nếu bạn đã mua một micro và giao diện tốt cách đây một thập kỷ trở lại hoặc hơn, có khả năng lớn là, nếu nó không hỏng, nó vẫn tốt cho hôm nay. Nhưng có một định dạng tương đối mới có thể (có thể) đáng giá nâng cấp luồng làm việc nếu bạn làm video: âm thanh 32-bit float.
Khẳng định phổ biến nhất bạn sẽ nghe khi nói về âm thanh 32-bit float là nó loại bỏ nhu cầu thiết lập cấp độ bao giờ nữa, nơi bạn đảm bảo âm thanh không vượt quá và biến dạng. Và điều đó có phần đúng. Nhưng có nghĩa là bạn cần nâng cấp tất cả các thiết bị của mình để đảm bảo âm thanh ồn ào và âm thanh yếu được truyền tải rõ ràng mà không cần suy nghĩ đến việc thiết lập cấp độ không? Không nhất thiết.
Để hiểu cách công nghệ này hoạt động, tôi đã nói chuyện với Korey Pereira, giám đốc âm thanh tại Chez Boom Audio ở Austin, Texas, và một biên tập âm thanh độc lập đã làm việc gần đây nhất cho mùa mới nhất của Stranger Things.
Nếu bạn mua một sản phẩm bằng các liên kết trong câu chuyện của chúng tôi, chúng tôi có thể kiếm được hoa hồng. Điều này giúp hỗ trợ nền báo chí của chúng tôi. Tìm hiểu thêm.
Độ sâu bit trong âm thanh đề cập đến số bit có sẵn cho mỗi mẫu của tín hiệu âm thanh. Ví dụ, trong âm thanh 16-bit (như những gì bạn đã nghe từ đĩa CD), có 16 bit kỹ thuật số (tự nhiên) có thể mô tả 65,536 cấp độ biên độ âm thanh (âm lượng âm thanh). Âm thanh 24-bit, trong khi đó, có thể ghi lại hơn 16.7 triệu cấp độ khác nhau. Điều này không nên nhầm lẫn với bitrate, đó là bản chất là có bao nhiêu mẫu của tín hiệu âm thanh tương tự được lấy mỗi giây. (Ví dụ, một tệp âm thanh 96-kHz có 96,000 mẫu mỗi giây.)
Âm thanh 32-bit float tương tự như các tiêu chuẩn 16 và 24-bit, nhưng nó hoạt động một cách khác một chút. Thay vì đếm các cấp độ biên độ rời rạc cho tín hiệu âm thanh, giá trị được mô tả bản chất trong một biến thể nhị phân của quy tắc định dạng khoa học (một cách; các kỹ sư vui lòng không la mắng tôi). Vì vậy, thay vì viết một số như 136,234,000, số này có thể được biểu diễn dưới dạng 1.36234 x 10^8. Trong 32-bit float, có thể ghi lại lên đến 23 chữ số sau dấu thập phân và đến 8 số mũ có thể được ghi lại.
Đó là rất nhiều toán. Có quan trọng đối với bạn không? Có lẽ không. Nhưng đây là điều quan trọng cần nắm vững: Dưới 32-bit float, một phạm vi rộng lớn của giá trị âm thanh có thể được ghi lại. Rất nhiều hơn so với việc chỉ có tám bit mới để chơi.
Để hiểu rõ hơn, âm thanh 16-bit có thể ghi âm với dải động lên đến 96.3 decibels. Bản ghi âm thanh 24-bit có thể chụp lại một dải động lên đến 144.5 dB. Trong khi đó, âm thanh 32-bit float có thể chụp lại dải động tuyệt vời lên đến 1,528 dB. Điều này không chỉ vượt xa phạm vi của âm thanh 24-bit mà còn vượt qua quy mô của điều gì thậm chí được coi là một âm thanh trên Trái Đất.
Để có cái nhìn tổng quan hơn, một người thì thầm có thể là khoảng 20 đến 30 dB, trong khi một cuộc trò chuyện điển hình là khoảng 60 dB. Một chiếc xe máy đi qua có thể là khoảng 90 dB, và một buổi hòa nhạc thật ồn ào có thể ở khu vực 110 dB. Cao hơn nhiều so với điều này và bạn đang vào một phạm vi nơi âm thanh trở nên đau đớn về mặt vật lý. Nếu đó là trường hợp, tại sao bất kỳ thiết bị ghi âm nào cần phải vượt qua phạm vi động 144.5 dB của âm thanh 24-bit?
Dải động 32-bit float audio điên rồ của nó là nơi mà quảng cáo rằng bạn không bao giờ cần phải đặt cấp độ đến từ, tuy nhiên điều này còn phức tạp hơn một chút. Mức cao nhất mà một thiết bị có thể ghi âm được gọi là 0 dBFS (ở đây, FS đứng cho "full scale"). Bất cứ thứ gì cao hơn điều này sẽ bị cắt bớt, đó là lý do tại sao nó nghe có vẻ méo mó khi các YouTuber la hét như vậy.
Thường thì bạn sẽ đặt cấp độ âm thanh khi thiết lập thiết bị của bạn để tránh va chạm với giới hạn đó. Việc đặt cấp độ này liên quan đến việc áp dụng độ gia tăng cho tín hiệu từ mic, đó là một bước không thể đảo ngược làm suy giảm dải động ngay cả trong quay 24-bit.
“Khi bạn ghi âm âm thanh trên bộ quay, bạn thường sẽ áp dụng độ gia tăng. Và một số máy ghi âm sẽ áp dụng từ 30 đến 90 decibels gia tăng,” Pereira giải thích. “Điều này có ích khi bạn có một cảnh yên tĩnh nơi hai người đang thì thầm. Vì vậy, bạn có thể vặn nút trên máy ghi âm lên chẳng hạn, cộng 60 [decibels]. Vì vậy bây giờ khi ai đó quyết định la hét, từ 60 đến 145, đó không phải là một dải động nhiều.”
Với quay âm 32-bit float, ngược lại, việc áp dụng gia tăng trước khi ghi âm không cần thiết. “Khi bạn ghi âm trong định dạng 32-bit, không có nút âm lượng, nó thực sự chỉ tạo ra một biểu đồ toán học của dữ liệu mà sau đó có thể nội suy trong sản xuất sau,” Pereira nói.
Đặt cấp độ trên các hệ thống 24-bit có thể phức tạp vì độ ồn nền. Để giản lược, dù bạn làm cho không gian ghi âm của mình đặc biệt yên tĩnh nhưng luôn có một lượng độ ồn từ các đối tượng xung quanh, hoặc thậm chí là các thiết bị điện tử bạn ghi âm. Thêm độ gia tăng vào tín hiệu trong quá trình ghi âm sẽ khuếch đại độ ồn đó, cũng như nguồn âm thanh của bạn, và khi nó được tích hợp vào bản ghi, nó sẽ ở đó mãi mãi.
Quay âm 32-bit float mang lại sự linh hoạt hơn để điều chỉnh sau thực tế (và trong một số trường hợp, nó thậm chí có thể giúp giải quyết vấn đề tiếng ồn ở mức thấp). Tuy nhiên, quan trọng là không để điều này làm cho nhà làm phim và nhà sản xuất âm thanh có cảm giác an toàn một cách giả tưởng. “Nó sẽ không khắc phục những vấn đề cố hữu của địa điểm quay phim của bạn. Ví dụ, nếu có một máy lạnh hoặc quạt ồn gần, quay âm 32-bit không làm cho tiếng ồn đó biến mất,” Pereira nói.
Quản lý tiếng ồn trên bộ quay, và đảm bảo micro đã chụp tín hiệu một cách đúng đắn sẽ luôn quan trọng, nhưng khi thiết bị của bạn được thiết lập đúng, khả năng ghi âm ngay cả sau điểm đỉnh là một công cụ hữu ích trong tay. Nhưng đừng mong đợi bỏ qua âm 24-bit mãi mãi.
Vậy nếu 32-bit tuyệt vời, tại sao nó không phải là mặc định? Đầu tiên, nhiều bước sản xuất–bao gồm chỉnh sửa, kết hợp, và đặc biệt là phân phối–sẽ sử dụng quy trình làm việc 24-bit, điều này có nghĩa là dữ liệu thêm sẽ bị mất tại một số điểm nào đó. Và một kỹ sư âm thanh ở một giai đoạn nào đó sẽ cần điều chỉnh để đảm bảo rằng tín hiệu âm thanh không bị cắt khi giảm mẫu xuống 24-bit, giống như nó sẽ nếu cấp độ không được đặt đúng trong quá trình ghi âm ban đầu.
Điều này đồng nghĩa với việc công việc mà ban đầu sẽ được thực hiện trên bộ quay được chuyển sang sản xuất sau. Vì vậy, bạn có một lựa chọn: Hoặc đặt cấp độ đúng cách trên bộ quay và ghi âm trực tiếp ở định dạng 24-bit, hoặc ghi âm ở định dạng 32-bit và thêm bước phụ sau này. Một cách hoặc một cách khác, đó là một bước bạn sẽ phải thực hiện, và có người cho rằng bạn cũng có thể làm nó khi bạn đang ở trên bộ quay.
Tuy nhiên, có những tình huống nơi có chỗ cho sự sai sót có thể là một lợi ích. “Nơi tôi thực sự thấy 32-bit có lợi thế lớn là đối với những nhà báo đang ghi âm ngoài trời, hoặc đối với những nhà làm phim tài liệu đang ghi lại những điều bạn chỉ có một lần và có thể không dự đoán được,” Pereira nói.
Nó cũng có thể hữu ích cho các buổi quay của các nhà làm phim độc lập nơi mà mỗi người thường phải làm nhiều công việc và không luôn có người rảnh rỗi để theo dõi cấp độ liên tục. Tất nhiên, còn có cách khác để vượt qua thách thức này–một số máy ghi âm, như Zoom H6 chẳng hạn, có thể ghi âm một bản dự phòng với độ gia tăng thấp hơn để bắt âm thanh đỉnh điểm.
Cũng có vấn đề về kích thước tệp cần xem xét với ghi âm 32-bit, tuy nhiên nó hơi bị nổi lên. Nói chung, bạn có thể mong đợi âm thanh 32-bit sẽ lớn khoảng 33% so với ghi âm 24-bit, điều này không phải là không đáng kể, đặc biệt là nếu bạn ghi âm nhiều giờ. Ngược lại, đó là ít hơn nhiều so với sự khác biệt giữa, ví dụ, chuyển từ quay 1080p sang 4K.
Như mọi thứ khác, ghi âm 32-bit float là một công cụ bạn có thể giữ trong túi của mình khi bạn cần. Chúng tôi có thể không đề xuất mọi người đều ra ngoại việc thử nghiệm một máy ghi âm 32-bit như Zoom F6 ($700) hoặc F3 ($350) ngay lập tức. Nhưng ở một số tình huống, đối với một số sản phẩm, có thể hữu ích khi có sẵn.