Trạng thái | Published |
---|---|
Xuất bản lần đầu | 1994; 30 năm trước |
Phiên bản mới nhất | URL Living Standard 28 tháng 4 năm 2020; 4 năm trước |
Tổ chức | Request for Comments (RFC) |
Ủy ban | Internet Engineering Task Force (IETF) Web Hypertext Application Technology Working Group (WHATWG) |
Tác giả | Tim Berners-Lee |
Tiêu chuẩn liên quan | URI, URN |
Domain | World Wide Web |
License | CC BY 4.0 |
Viết tắt | URL |
Website | https://url.spec.whatwg.org |
Uniform Resource Locator (viết tắt là URL, tiếng Việt: Hệ thống định vị tài nguyên thống nhất; thường được gọi là địa chỉ web) là một tham chiếu đến tài nguyên web, chỉ định vị trí của nó trên mạng máy tính và cách thức truy xuất. URL là một dạng Mã nhận dạng tài nguyên thống nhất (URI). Ví dụ, http://www.example.com
là một URL, trong khi www.example.com
thì không phải. Giao thức URL phổ biến nhất là HTTP, nhưng cũng có các giao thức khác như FTP cho truyền file, Mailto cho email, JDBC cho truy cập cơ sở dữ liệu, và nhiều giao thức khác.
Hầu hết các trình duyệt web hiển thị URL của trang web ở phía trên, trong thanh địa chỉ. Một URL thông thường có dạng http://www.example.com/index.html
, chỉ ra giao thức (HTTP), tên máy chủ (www.example.com
), và tên tệp (index.html
).
Lịch sử URL
URL (Bộ định vị tài nguyên thống nhất) được Tim Berners-Lee, người sáng tạo ra World Wide Web, và nhóm làm việc URI của IETF định nghĩa trong RFC 1738 vào năm 1994, kết quả của sự hợp tác bắt đầu từ cuộc họp IETF Living Documents Bird of a Feather năm 1992.
Định dạng này kết hợp hệ thống tên miền (được tạo năm 1985) với cú pháp đường dẫn tệp, sử dụng dấu gạch chéo để phân tách tên thư mục và tên tệp. Các quy ước đã có từ trước, trong đó tên máy chủ có thể được thêm vào trước dấu gạch chéo kép (//
) để hoàn thiện các đường dẫn tệp.
Berners-Lee sau này đã bày tỏ hối tiếc về việc sử dụng dấu chấm để phân tách các phần của tên miền trong URI, ông nói rằng lẽ ra ông nên sử dụng dấu gạch chéo trong toàn bộ địa chỉ, và cũng cho rằng hai dấu gạch chéo trước tên miền là không cần thiết.
Bản nháp đầu tiên (1993) của HTML Specification đề cập đến Bộ định vị tài nguyên 'phổ quát'. Điều này đã bị loại bỏ vào khoảng thời gian từ tháng 6 năm 1994 (RFC 1630) đến tháng 10 năm 1994 (dự thảo-ietf-uri-url-08.txt).
Cấu trúc URL
Mỗi URL HTTP đều tuân theo chuẩn cú pháp của URI. Một URL bao gồm nhiều phần như sau:
- Scheme của URI hay phương thức truy cập thường là tên giao thức (ví dụ: HTTP, FTP) nhưng cũng có thể là tên khác (ví dụ: news, mailto). Để hiểu rõ về scheme của URL, xin xem URI scheme
- Tên máy chủ (ví dụ: vi.wikipedia.org)
- Có thể có thêm chỉ định cổng (không bắt buộc)
- Đường dẫn tuyệt đối đến tài nguyên trên máy chủ (ví dụ: thumuc/trang)
- Các truy vấn (không bắt buộc)
- Chỉ định mục con (không bắt buộc)
Chi tiết hơn:
https://vi.wikipedia.org/wiki/thumuc/trang?timkiem=cauhoi \__/ \_________________/\___________/ \____________/ \_____/ | | | | | | Scheme URL tên máy chủ | đường dẫn truy vấn mục con cổng
Hiện nay, hàng ngày có rất nhiều tên miền mới (domain) xuất hiện trên toàn thế giới (ví dụ: org).
Để tìm một đường dẫn Internet dẫn đến nội dung cần thiết, người dùng có thể sử dụng các công cụ tìm kiếm trực tuyến ngày càng phổ biến. Ngoài ra, việc tra cứu URL thích hợp qua danh bạ website hoặc các công cụ tìm kiếm cũng là một lựa chọn.
URL quốc tế hóa
Người dùng Internet trên toàn cầu sử dụng nhiều ngôn ngữ và bảng chữ cái khác nhau, và mong muốn tạo URL bằng bảng chữ cái địa phương của họ. Mã định danh tài nguyên quốc tế hóa (IRI) là một dạng URL cho phép sử dụng các ký tự Unicode. Hầu hết các trình duyệt hiện đại đều hỗ trợ IRI. Các phần của URL cần xử lý đặc biệt cho các bảng chữ cái khác nhau bao gồm tên miền và đường dẫn.
Trong IRI, tên miền được gọi là Tên miền Quốc tế hóa (IDN). Phần mềm web và Internet tự động chuyển đổi tên miền thành định dạng chữ thập sử dụng được bởi Hệ thống tên miền; ví dụ: URL tiếng Trung http://例子.卷筒纸
được chuyển thành http://xn--fsqu00a.xn--3lr804guic/
. xn--
cho biết ký tự ban đầu của URL không phải là ký tự ASCII.
Mối liên hệ giữa URL và URN, URI
Về mặt kỹ thuật, URL là một loại URI, nhưng trong nhiều tài liệu và cuộc thảo luận, URL thường được dùng thay cho URI mà không gặp phải vấn đề gì.
URI có thể được phân loại thành nhận dạng (URL), tên gọi (URN), hoặc cả hai. Một Định danh tài nguyên thống nhất (URN) tương tự như tên của một người, trong khi một Định vị tài nguyên thống nhất (URL) giống như địa chỉ của người đó. Nói cách khác, URI xác định sự nhận dạng của đối tượng, URN đặt tên cho đối tượng, còn URL cung cấp cách để tìm đối tượng đó.
Hệ thống mã số ISBN là một ví dụ cụ thể về URN. Mã ISBN 0486275574 (run:isbn:0-486-27557-4) chỉ ra đây là ấn bản kịch bản Romeo và Juliet của Shakespeare. Để tìm cuốn sách này, cần biết địa chỉ URL của nó, ví dụ trên hệ thống Unix có thể là: file:///home/username/RomeoAndJuliet.pdf, đó là đường dẫn đến tập tin lưu trên ổ cứng. Vì vậy, URN và URL hỗ trợ và bổ sung cho nhau.
Chú giải
Tài liệu tham khảo
- “Berners-Lee 'xin lỗi' về các dấu gạch chéo”. BBC News. ngày 14 tháng 10 năm 2009. Truy cập ngày 14 tháng 2 năm 2010.
- “Biên bản cuộc họp Living Documents BoF”. World Wide Web Consortium. ngày 18 tháng 3 năm 1992. Truy cập ngày 26 tháng 12 năm 2011.
- Berners-Lee, Tim (ngày 21 tháng 3 năm 1994). “Uniform Resource Locators (URL): Cú pháp để biểu thị thông tin truy cập của các đối tượng trên mạng”. World Wide Web Consortium. Truy cập ngày 13 tháng 9 năm 2015.
- Uniform Resource Locators (URL). Tháng 8 năm 1998. RFC 1738. https://tools.ietf.org/html/rfc1738. Truy cập ngày 31 tháng 8 năm 2015.
- Berners-Lee, Tim (2015) [2000]. “Tại sao các dấu //, #, v.v.?”. Các câu hỏi thường gặp. World Wide Web Consortium. Truy cập ngày 3 tháng 2 năm 2010.
- Connolly, Daniel 'Dan'; Sperberg-McQueen, C. Michael biên tập (ngày 21 tháng 5 năm 2009). “Địa chỉ web trong HTML 5”. World Wide Web Consortium. Truy cập ngày 13 tháng 9 năm 2015.
- Cơ quan số đã chỉ định Internet (ngày 14 tháng 2 năm 2003). “Hoàn tất việc lựa chọn tiền tố IDNA của IANA”. Danh sách gửi thư IETF-Announce. Bản gốc lưu trữ ngày 8 tháng 12 năm 2004. Truy cập ngày 3 tháng 9 năm 2015.
- Uniform Resource Identifiers (URI): Cú pháp chung. Tháng 8 năm 1998. RFC 2396. https://tools.ietf.org/html/rfc2396. Truy cập ngày 31 tháng 8 năm 2015.
- Thaler, Dave, ed (Tháng 6 năm 2015). Hướng dẫn và Quy trình Đăng ký cho Các Chế độ URI. RFC 7595. https://tools.ietf.org/html/rfc7595.
- Báo cáo từ Nhóm Quan tâm Kế hoạch URI W3C/IETF: Uniform Resource Identifiers (URIs), URLs, và Uniform Resource Names (URNs): Làm rõ và Khuyến nghị. Tháng 8 năm 2002. RFC 3305. https://tools.ietf.org/html/rfc3305. Truy cập ngày 13 tháng 9 năm 2015.
- Uniform Resource Identifiers (URI): Cú pháp chung. Tháng 1 năm 2005. RFC 3986. https://tools.ietf.org/html/rfc3986. Truy cập ngày 31 tháng 8 năm 2015.
- “Giới thiệu về các địa chỉ web đa ngôn ngữ”. ngày 9 tháng 5 năm 2008. Truy cập ngày 11 tháng 1 năm 2015.
- Phillip, A. (2014). “Những gì đang xảy ra với 'URL quốc tế hóa'”. World Wide Web Consortium. Truy cập ngày 11 tháng 1 năm 2015.
- Lawrence, Eric (ngày 6 tháng 3 năm 2014). “Khoa học về Trình duyệt: IP Literals trong URLs”. IEInternals. Microsoft. Truy cập ngày 25 tháng 4 năm 2016.
Liên kết bên ngoài
- Tài liệu quy định URL tại WHATWG
- Các thành phần của URL từ IBM