Tài liệu (tiếng Anh: tài liệu, viết tắt cho tập thông tin, còn được gọi là tệp, tệp tin) là một tập hợp của thông tin được đặt tên. Thông thường thì các tài liệu này chứa trong các thiết bị lưu trữ như đĩa cứng, đĩa mềm, CD, DVD cũng như là các loại chip điện tử dùng kĩ thuật flash có thể thấy trong các ổ nhớ có giao diện USB. Nói cách khác, tài liệu là một dãy các bit có tên và được chứa trong các thiết bị lưu trữ dữ liệu kỹ thuật số. trong phần mềm.
Đặc điểm
- Một tài liệu luôn luôn kết thúc bằng 1 ký tự đặc biệt (hay dấu kết thúc) có mã ASCII là 255 ở hệ thập phân. Ký tự này thường được ký hiệu là EOF (từ chữ End Of File).
- Một tài liệu có thể không chứa một thông tin nào ngoại trừ tên và dấu kết thúc. Tuy nhiên, điều này không hề mâu thuẫn với định nghĩa vì bản thân tên của tài liệu cũng đã chứa thông tin. Những tài liệu này gọi là tài liệu rỗng hay tài liệu trống.
- Độ dài (kích thước) của tài liệu có thể chỉ phụ thuộc vào khả năng của máy tính, khả năng của hệ điều hành cũng như vào phần mềm ứng dụng dùng nó. Đơn vị nhỏ nhất dùng để đo độ dài của tài liệu là byte. Độ dài của tài liệu không bao gồm độ dài của tên tài liệu và dấu kết thúc.
Thuộc tính
Các đặc tính và giới hạn của tập tin được gọi là thuộc tính của tập tin.
Các loại thuộc tính
Tuỳ thuộc vào hệ thống tập tin, các thuộc tính này có thể khác nhau.
Ví dụ các thuộc tính trên hệ thống tập tin FAT bao gồm:
Ngoài ra, còn rất nhiều thuộc tính khác của các tập tin mà tùy theo hệ điều hành sẽ được định nghĩa thêm.
Ví dụ về hệ điều hành Linux, các tập tin có thể có các thuộc tính như quyền sử dụng, đặc điểm và loại tập tin như liên kết mềm, socket, pipe...
Lưu ý: Các thuộc tính của tập tin thường không ảnh hưởng đến nội dung nhưng lại ảnh hưởng đáng kể đến chức năng và việc sử dụng tập tin. Ví dụ, các tập tin không có quyền thi hành không thể xem là phần mềm khả thi dù có chỉ thị máy tính. Để làm tập tin trở nên khả thi, có thể thay đổi thuộc tính hoặc phần đuôi tên tập tin (như trong hệ điều hành Windows - DOS).
Định dạng
Cấu trúc của tập tin định nghĩa cách tập tin được chứa, thực thi và hiển thị trên các thiết bị như màn hình hoặc máy in, được gọi là định dạng của tập tin. Định dạng có thể đơn giản hoặc phức tạp.
Định dạng của tập tin phụ thuộc vào nhiều yếu tố, quan trọng nhất là:
- Các hệ điều hành giống nhau nhưng có kiến trúc máy tính khác nhau có thể yêu cầu các định dạng tập tin khác nhau.
- Ví dụ: Trên cùng một kiến trúc Intel, tập tin văn bản đơn giản nhất được tạo ra bởi hệ điều hành Linux cũng khác biệt so với tập tin văn bản của Windows (hoặc DOS). Tất nhiên, những tập tin này cũng không thể đọc được trên các máy chạy hệ điều hành Mac OS (các máy này có kiến trúc máy tính khác hoàn toàn) nếu thiếu các tiện ích đặc biệt để chuyển đổi định dạng.
- Các tập tin dành cho các mục đích khác nhau cũng có các định dạng khác nhau. Ngoài ràng buộc định dạng từ hệ điều hành, các tập tin dùng trong các ứng dụng hay phần mềm khác nhau cũng sẽ khác nhau và điều này phụ thuộc vào kiến trúc của từng ứng dụng sử dụng các tập tin đó.
- Ví dụ dễ hiểu nhất là định dạng của một tập tin văn bản phải khác với định dạng của một tập tin hình ảnh hoặc âm thanh.
- Các tập tin dành cho cùng một mục đích cũng không thể có định dạng khác nhau tuỳ thuộc vào nhà sản xuất thiết kế nó.
- Ví dụ: Trong các tập tin đồ họa, các tập tin dạng Bitmap (có đuôi là .bmp) khác hoàn toàn với các tập tin dạng Tagged Image File Format (có đuôi là .tif) và cũng khác với các tập tin dạng Joint Photographic Experts Group (có đuôi .jpg hoặc .png).
Tên tập tin
- Tên tập tin có thể có các quy ước khác nhau tùy thuộc vào hệ điều hành.
- Độ dài của tên tập tin phụ thuộc vào hệ thống tập tin sử dụng.
- Tùy thuộc vào hệ thống tập tin và hệ điều hành, một số ký tự không được phép sử dụng trong tên tập tin.
- Ví dụ: Trên hệ điều hành Microsoft Windows, các ký tự sau không được sử dụng trong tên tập tin: /: * ? ' < > | và tên tập tin không quá 255 ký tự thường.
- Theo truyền thống của hệ thống DOS và Windows, tên tập tin thường gồm hai phần: phần tên và phần mở rộng (hay còn gọi là phần đuôi). Tuy nhiên, một tập tin không nhất thiết phải có phần mở rộng này.
- Trên Windows hiện đại, một số tập tin có thể không có phần tên; trong trường hợp này, tập tin bắt buộc phải có phần mở rộng.
Cấu trúc bit trong nội dung thông tin của các tập tin
Ví dụ về cấu trúc bit của tập tin ASCII

chỉnh sửatrình soạn thảo viký tự xuống dòngký tự dòng mớiVí dụ về cấu trúc bit của tập tin ảnh

- Microsoft Press Computer Dictionary: Từ điển máy tính toàn diện tiêu chuẩn cho doanh nghiệp, trường học, thư viện và gia đình. Sách bìa cứng. Lần xuất bản thứ 2. Redmond, WA (Mỹ): Microsoft Corp. Ngày 1 tháng 10 năm 2003. ISBN 1-55615-597-2. Tiếng Anh.
- Evi Nemeth, Garth Snyder, Scott Seebass, và Trent R. Hein. UNIX System Administration Handbook. Lần xuất bản thứ 2. Indianapolis, IN (Mỹ): Prentice Hall PTR. Ngày 15 tháng 1 năm 1995. ISBN 0-13-151051-7. Tiếng Anh.
- Tom Swan, Bên trong định dạng tập tin Windows. Lần xuất bản đầu tiên. SAM Publishing. 1993. ISBN 0-672-30338-8. Tiếng Anh.
- Hệ thống tập tin
- Hệ thống quản lý tập tin
- Sao chép tập tin
