Nén hình ảnh là một phương pháp nén dữ liệu đặc biệt cho hình ảnh kỹ thuật số nhằm giảm chi phí lưu trữ hoặc truyền tải. Các thuật toán nén hình ảnh tận dụng các đặc điểm thị giác và các thuộc tính thống kê của dữ liệu để đạt hiệu quả vượt trội so với các phương pháp nén dữ liệu chung.
Nén hình ảnh có thể là tổn hao hoặc không tổn hao
Nén hình ảnh có thể có tổn hao hoặc không tổn hao. Nén không tổn hao thường được ưa chuộng cho lưu trữ và trong các ứng dụng như hình ảnh y tế, bản vẽ kỹ thuật, clip art hoặc truyện tranh. Trong khi đó, nén tổn hao, đặc biệt khi sử dụng ở tốc độ bit thấp, thường phù hợp với hình ảnh tự nhiên, nơi sự suy giảm chất lượng là chấp nhận được để giảm tốc độ bit. Nén tổn hao tạo ra sự khác biệt nhỏ, được gọi là tổn hao thị giác.
Các phương pháp nén không mất dữ liệu bao gồm:
- Mã hóa với độ dài thay đổi - thường được áp dụng trong các định dạng như PCX và là một tùy chọn trong BMP, TGA, TIFF
- Nén theo khu vực ảnh
- DPCM và mã hóa dự đoán
- Mã hóa Entropy
- Các thuật toán từ điển thích ứng như LZW - sử dụng trong GIF và TIFF
- DEFLATE - sử dụng trong PNG, MNG và TIFF
- Mã hóa chuỗi
Các phương pháp nén có tổn hao bao gồm:
- Giảm số lượng màu sắc trong ảnh xuống các màu phổ biến nhất. Các màu này được lưu trữ trong bảng màu trong tiêu đề ảnh nén, và mỗi pixel chỉ tham chiếu đến chỉ số của màu trong bảng màu. Phương pháp này có thể kết hợp với phối màu để giảm hiện tượng phân đoạn màu sắc.
- Lấy mẫu sắc độ. Phương pháp này dựa vào việc mắt người nhạy cảm hơn với sự thay đổi độ sáng so với màu sắc, nên chỉ lấy mẫu một phần thông tin sắc độ để nén ảnh.
- Mã hóa chuyển đổi. Phương pháp phổ biến nhất, sử dụng biến đổi Fourier như Biến đổi Cosine rời rạc (DCT), hoặc gần đây hơn là biến đổi wavelet, cùng với lượng tử hóa và mã hóa entropy.
- Nén Fractal.
Các đặc tính khác
Mục tiêu chính của nén hình ảnh là đạt được chất lượng hình ảnh tối ưu ở tốc độ nén (hoặc tốc độ bit) cụ thể, nhưng còn nhiều thuộc tính quan trọng khác trong nén hình ảnh:
- Chất lượng lũy tiến hoặc lớp lũy tiến: Dòng bit liên tục cải thiện hình ảnh khi được tái tạo.
- Độ phân giải lũy tiến: Mã hóa độ phân giải thấp trước, sau đó mã hóa sự khác biệt để đạt độ phân giải cao hơn.
- Thành phần lũy tiến: Bắt đầu với mã hóa màu xám, sau đó bổ sung màu sắc đầy đủ.
Vùng mã hóa quan tâm. Một số phần của hình ảnh được mã hóa với chất lượng cao hơn các phần khác. Điều này có thể kết hợp với khả năng mở rộng bằng cách mã hóa các phần quan trọng trước, các phần còn lại sau.
Thông tin tổng hợp. Dữ liệu nén có thể chứa thông tin về hình ảnh, như thống kê màu sắc và kết cấu, hình ảnh xem trước nhỏ, và thông tin tác giả hoặc bản quyền, giúp phân loại, tìm kiếm, hoặc duyệt ảnh dễ dàng hơn.
Sức mạnh xử lý. Mỗi thuật toán nén yêu cầu mức độ xử lý khác nhau để thực hiện mã hóa và giải mã. Một số thuật toán nén hiệu quả cao đòi hỏi khả năng xử lý mạnh mẽ hơn.
Chất lượng nén thường được đánh giá qua tỷ lệ nhiễu tín hiệu cực đại. Đây là chỉ số đo lượng nhiễu phát sinh khi nén hình ảnh bị mất dữ liệu, tuy nhiên, đánh giá chủ quan của người dùng cũng là một yếu tố quan trọng, có thể là yếu tố chính.
Ghi chú và tài liệu tham khảo
- ^ “Nén dữ liệu hình ảnh”.
- ^ Burt, P.; Adelson, E. (1 tháng 4 năm 1983). “Pyramid Laplacian như một mã hình ảnh nén”. IEEE Transactions on Communications. 31 (4): 532–540. CiteSeerX 10.1.1.54.299. doi:10.1109/TCOM.1983.1095851.
- ^ Shao, Dan; Kropatsch, Walter G. (3–5 tháng 2 năm 2010). Špaček, Libor; Franc, Vojtěch (biên tập). “Pyramid Laplacian không đều” (PDF). Hội thảo Mùa đông Computer Vision 2010. Nové Hrady, Cộng hòa Czech: Hội Pattern Recognition Czech.
Các liên kết ngoài
- Nén hình ảnh – bài giảng từ MIT OpenCourseWare
- Các nguyên tắc cơ bản trong mã hóa hình ảnh
- Nghiên cứu về nén hình ảnh – bao gồm các cơ bản và so sánh các phương pháp nén như JPEG2000, JPEG và JPEG XR / HD Photo
- Thông tin cơ bản về nén dữ liệu – so sánh các định dạng PNG, JPEG và JPEG-2000
- Câu hỏi thường gặp: Tình trạng hiện tại của nén hình ảnh không mất dữ liệu là gì? Lưu trữ ngày 23 tháng 7 năm 2011 tại Wayback Machine.
- IPRG Lưu trữ ngày 28 tháng 12 năm 2020 tại Wayback Machine – một nhóm nghiên cứu mở liên quan đến tài nguyên xử lý hình ảnh