
Dữ liệu được hiểu là chuỗi các ký hiệu hoặc ký tự có ý nghĩa thông qua việc thực hiện một hành động cụ thể.
Để chuyển đổi dữ liệu thành thông tin, cần phải có sự giải thích. Điều này bao gồm việc xem xét các yếu tố như người hoặc vật tạo ra dữ liệu và mục đích thông tin từ dữ liệu đó. Thuật ngữ siêu dữ liệu đề cập đến các dữ liệu dùng để mô tả hoặc tham khảo dữ liệu khác. Siêu dữ liệu có thể được hiểu ngầm, chỉ định hoặc cung cấp trước. Dữ liệu liên quan đến các sự kiện hoặc quá trình vật lý thường có yếu tố thời gian, thường được hiểu ngầm. Ví dụ, máy ghi nhiệt độ nhận dữ liệu từ cảm biến nhiệt độ và tự động gán thời gian ghi nhận là 'hiện tại'. Vì vậy, thiết bị ghi lại cả ngày, giờ và nhiệt độ. Khi máy ghi dữ liệu báo cáo nhiệt độ, nó cũng cần xuất ra ngày giờ (siêu dữ liệu) cho từng giá trị nhiệt độ.
Dữ liệu số được biểu diễn bằng hệ nhị phân với các số 1 và 0, trái ngược với dữ liệu tương tự. Trong các hệ thống máy tính hiện đại (sau năm 1960), tất cả dữ liệu đều ở dạng số. Hầu hết dữ liệu di chuyển trong máy tính dưới dạng song song, trong khi dữ liệu di chuyển giữa các máy tính thường là nối tiếp. Dữ liệu từ thiết bị tương tự, chẳng hạn như cảm biến nhiệt độ, cần phải qua bộ chuyển đổi tín hiệu từ tương tự sang số (ADC).
Dữ liệu biểu diễn số lượng, thuộc tính hoặc ký hiệu hành động được máy tính lưu trữ trên ổ cứng từ, đĩa quang và truyền dưới dạng tín hiệu điện.
Chương trình là tập hợp dữ liệu bao gồm chuỗi mã lệnh phần mềm dùng để điều khiển hoạt động của máy tính hoặc các loại máy móc khác. Các thành phần của bộ nhớ máy tính vật lý bao gồm một địa chỉ và một đơn vị lưu trữ (byte/từ). Dữ liệu số thường được lưu trữ trong các cơ sở dữ liệu quan hệ dưới dạng bảng hoặc cơ sở dữ liệu SQL và được biểu diễn dưới dạng cặp khóa/giá trị trừu tượng.
Dữ liệu có thể được tổ chức trong nhiều cấu trúc dữ liệu khác nhau, chẳng hạn như mảng, đồ thị và đối tượng. Cấu trúc dữ liệu lưu trữ nhiều loại dữ liệu, bao gồm số, chuỗi và thậm chí các cấu trúc dữ liệu khác. Dữ liệu di chuyển vào và ra khỏi máy tính thông qua các thiết bị ngoại vi.
Một cách sử dụng khác, các tệp nhị phân (không thể đọc được bởi con người) đôi khi được gọi là 'dữ liệu', khác với văn bản thô mà 'con người có thể đọc được'. Ước tính tổng dữ liệu số vào năm 2007 là 281 tỉ gigabytes (= 281 exabytes). Dữ liệu số có ba trạng thái: dữ liệu được lưu trữ, dữ liệu đang di chuyển và dữ liệu đang sử dụng.
