Byte (đọc là bai-(tơ)) là đơn vị lưu trữ dữ liệu cho máy tính, áp dụng cho mọi loại dữ liệu. Nó cũng là một kiểu dữ liệu trong nhiều ngôn ngữ lập trình.
Ý nghĩa
Bội số của byte theo IEC 60027-2 | ||||||
---|---|---|---|---|---|---|
Tiền tố SI | Tiền tố nhị phân | |||||
Tên | Ký hiệu | Bội số | Tên | Ký hiệu | Bội số | |
kilobyte | kB | 10 (hay 2) | kibibyte | KiB | 2 | |
megabyte | MB | 10 (hay 2) | mebibyte | MiB | 2 | |
gigabyte | GB | 10 (hay 2) | gibibyte | GiB | 2 | |
terabyte | TB | 10 (or 2) | tebibyte | TiB | 2 | |
petabyte | PB | 10 (hay 2) | pebibyte | PiB | 2 | |
exabyte | EB | 10 (hay 2) | exbibyte | EiB | 2 | |
zettabyte | ZB | 10 (hay 2) | ||||
yottabyte | YB | 10 (hay 2) |
Thuật ngữ 'byte' có một số nghĩa liên quan với nhau:
- Chuỗi bit cố định. Hầu hết máy tính hiện đại sử dụng byte 8 bit (octet). Tuy nhiên, một số máy tính cũ sử dụng byte với 6, 7 hoặc 9 bit, ví dụ như máy PDP-10 với cấu trúc 36 bit, hay máy NCR-315. Byte là đơn vị nhỏ nhất có thể truy cập và byte 8 bit có thể biểu thị 256 giá trị khác nhau, từ 0 đến 255 cho số không dấu, hoặc từ -128 đến 127 cho số có dấu, hoặc ký tự mã 7 bit (như ASCII) hoặc 8 bit.
- Chuỗi bit tạo thành một 'sub-field' trong một dãy số dài hơn được gọi là 'word'. Một số máy tính cho phép truy cập byte với độ dài tùy ý, như trong các câu lệnh assembly LDB và DPB của máy PDP-10, hay byte 6 bit của máy IBM 1401.
- Trong một số ngôn ngữ lập trình, byte là kiểu dữ liệu hoặc từ đồng nghĩa với kiểu dữ liệu. Trong C, byte là đơn vị có thể chứa bất kỳ ký tự nào trong môi trường hoạt động, với ít nhất 8 bit và có thể lưu trữ 256 giá trị khác nhau. Trong Java, kiểu dữ liệu byte có 8 bit và là kiểu dữ liệu có dấu, lưu giá trị từ -128 đến 127.
Định nghĩa tên gọi
Thuật ngữ byte do Werner Buchholz sáng tạo vào năm 1956 trong giai đoạn thiết kế đầu tiên của hệ thống IBM 7030. Ban đầu, nó được định nghĩa là từ 1 đến 6 bit, do các thiết bị I/O lúc đó sử dụng đơn vị 6 bit. Đến cuối năm 1956, byte đã được chuẩn hóa thành 8 bit, và kích thước này được chấp nhận rộng rãi trong hệ thống System/360. Tên gọi được tạo ra bằng cách thay đổi chữ bite (cắn, một trò chơi chữ với bit - miếng) để tránh bị nhầm lẫn với bit.
Những tên gọi khác
Byte 8 bit thường được gọi là octet (bộ tám) trong các tài liệu chính thức, mạng máy tính và viễn thông. Tên gọi này cũng được áp dụng trong một số ngôn ngữ không phải tiếng Anh, nơi trò chơi chữ bite không có nghĩa.
Một nửa của byte 8 bit (4 bit) thường được gọi là nibble (gặm). Nibble cũng có thể được gọi là semioctet (nửa octet) trong lĩnh vực mạng máy tính, viễn thông, và bởi một số tổ chức tiêu chuẩn.
Một cụm 32 bit được gọi là word, còn cụm 64 bit tương ứng được gọi là double word.
Một số biểu diễn với 8 bit: 10011001 (với bit đầu tiên là msb (bit quan trọng nhất), và bit cuối cùng là lsb (bit quan trọng nhất ít)).
Viết tắt
'Byte' thường được viết tắt là 'B', còn 'megabyte' được viết tắt là 'MB'.
''b'' là viết tắt của bit, ví dụ 10b có nghĩa là 10 bits, còn 10mb là 10 Megabits.
Cần phân biệt giữa bit ''b'' và Byte ''B''.
Tại một số quốc gia nói tiếng Pháp, chữ 'o' đôi khi được sử dụng để chỉ 'octet', nhưng điều này không được chấp nhận trong SI vì có thể gây nhầm lẫn với số 0.
Tên các đơn vị lớn hơn
Lưu ý: Các tên như 'kilobyte', 'megabyte', 'gigabyte', v.v. có thể áp dụng cho cả tiền tố SI và tiền tố nhị phân. Xem Tiền tố nhị phân để biết thêm chi tiết.
- Bit
- Octet
- Word
Liên kết ngoài
- nybble trên dictionary.com
Các kiểu dữ liệu | |
---|---|
Không xác định |
|
Số |
|
Con trỏ |
|
Văn bản |
|
Phức hợp |
|
Khác |
|
Chủ đề liên quan |
|