Hai dạng nén chính là Lossless và Lossy có cơ chế hoạt động và ưu nhược điểm khác nhau.
Tất cả người dùng máy tính đều quen thuộc với các định dạng File nén như ZIP và RAR, đặc biệt là những người làm việc với dữ liệu đa phương tiện như âm thanh, hình ảnh, video. File nén giúp chia sẻ dữ liệu một cách thuận tiện và tiết kiệm thời gian và băng thông, mặc dù có thể làm giảm chất lượng của dữ liệu.
File nén, mặc dù phức tạp và khó hiểu, nhưng bài viết này sẽ cố gắng giải thích một cách đơn giản để bạn hiểu được bản chất và cách thức hoạt động của các loại File nén, đặc biệt là hai dạng nén chính là Lossless và Lossy.
Nén theo phương pháp Lossless
Nén theo phương pháp Lossless sẽ loại bỏ các dữ liệu dư thừa một cách thông minh mà không làm mất dữ liệu. Bạn có thể tưởng tượng việc xếp các viên gạch để hiểu rõ hơn.
Bạn có thể thấy có các viên gạch cùng màu đại diện cho các phần dữ liệu giống nhau và lặp lại. Tuy nhiên, cách này không phải là duy nhất, có thể thay đổi để hiệu quả hơn.
Trong ví dụ này, chỉ cần một thuật toán và ba khối gạch để đại diện cho 10 khối gạch ban đầu. Bạn vẫn có đầy đủ thông tin về các loại gạch màu đỏ, vàng và xanh cũng như số lượng của chúng, mặc dù không gian đã được giảm đi đáng kể. Ví dụ này giới thiệu một cách cơ bản về kiểu nén Lossless, trong đó các thông tin giống nhau được thay thế bằng một biểu diễn đại diện và thuật toán biết số lượng chúng.
Một ví dụ khác đơn giản: dữ liệu 'fffffffuuuuuuuuuuuucc' sau khi nén theo kiểu Lossless trở thành 'f7u12c2'.
Mặc dù có nhiều dạng nén Lossless khác nhau sử dụng các thuật toán khác nhau, điều quan trọng là sau khi nén, dữ liệu có thể được tái tạo lại hoàn toàn giống như ban đầu, không có mất mát nào.
Các phần mềm như WinZip dùng kiểu nén Lossless, giảm dung lượng nhưng không mất dữ liệu sau khi giải nén. Trong các file hình ảnh, định dạng PNG cũng nén theo kiểu Lossless.
Các dữ liệu media, đặc biệt là file âm thanh thường sử dụng kiểu nén Lossless để đảm bảo giữ nguyên chất lượng. Mặc dù có nhiều định dạng Lossless khác nhau như FLAC, APE, TAK, ALAC, TTA, WAV, nhưng chúng đều giữ chất lượng giống như bản gốc sau khi giải nén.
Nén theo kiểu Lossy
Kiểu nén Lossy loại bỏ hoàn toàn một phần của dữ liệu, trái ngược với kiểu Lossless. Điều này có thể gây mất mát thông tin trong dữ liệu văn bản, nhưng lại thường được sử dụng trong dữ liệu media.
Các file MP3 là một ví dụ điển hình, hầu hết các file nhạc trên internet đều sử dụng định dạng này vì nó nhẹ và có dung lượng chỉ bằng 1/10 so với bản gốc. Tuy nhiên, một số âm thanh có thể bị loại bỏ, đặc biệt là những âm thanh ít nghe thấy. Nếu nén nhiều, dữ liệu mất đi cũng nhiều và chất lượng âm thanh sẽ giảm đi.
Một định dạng phổ biến khác là file hình ảnh JPEG. Hầu hết các bức ảnh chia sẻ trên internet không cần chất lượng cao như in ấn, mà thay vào đó là dung lượng nhỏ để dễ chia sẻ. Bằng cách loại bỏ một số dữ liệu như độ phân giải và điểm ảnh, bạn có thể nén dung lượng. Tuy nhiên, việc nén càng nhiều, chất lượng ảnh càng giảm, tùy thuộc vào mục đích sử dụng của ảnh.
Điều quan trọng nhất khi sử dụng kiểu nén Lossy là dữ liệu bị loại bỏ và không thể khôi phục lại như bản gốc. Một số bức ảnh in ra có chất lượng kém do người sử dụng nhầm lẫn định dạng.
Kết luận
Nhờ file nén theo kiểu Lossy, chúng ta có thể xem ảnh, nghe nhạc và xem video trực tuyến dễ dàng hơn. Kiểu nén Lossless giúp lưu giữ toàn bộ dữ liệu gốc, để thưởng thức nhạc tốt nhất (mặc dù cần thiết bị và khả năng thẩm âm tốt). Mặc dù có nhược điểm khác nhau, hai kiểu nén này vẫn tồn tại và hiệu quả, ít nhất là cho đến khi có cách chia sẻ dữ liệu tốt hơn.
Trên đây là những khái niệm cơ bản và được viết một cách dễ hiểu, nhưng thực tế, các định dạng và thuật toán rất phức tạp. Hy vọng bài viết này giúp bạn hiểu rõ hơn về file nén và hai kiểu nén dữ liệu Lossless và Lossy.
Tham khảo: makeuseof, wiki