统一资源标识符(uniform/universal resource identifier,URI)用于表示Internet中的资源(通常是文档)。URI 主要用于两种目的,其一是命名资源,尽管此时把他们叫做统一资源名称(URN)可能更加精确。其二,也是URI更常用的形式,是提供资源的路径或位置,此时它们叫做统一资源定位符(URL)。
URL的格式
所有URL都遵循以下通用格式:
scheme:object-address
其中,scheme一般指的是通信协议。常用的通信协议包括http、ftp、gopher、talnet、file、mailto以及news。不同的通信协议对应的object-address格式也不同。
HTTP协议支持Web,它用于请求和发送超文本标记语言(HTML)文档。当URL中的scheme为HTTP时,object-address应该为如下格式:
//完全限定域名/文档路径
对一个协议file协议用于表示正运行浏览器的计算机中的文档,这种方法可以测试要放到Web上的文档,而不会让其他所有浏览器看到该文档。当URL中的scheme为file时,
完全限定域名就可以省略了,整个URL应该为如下格式:
file://文档路径
注意:URL中不得包含空格,不得包含分号、冒号和&符号。如果要在URL中嵌入空格或者特殊字符,必须将其写为百分号%加ASCII码的形式,其中ASCII码
是一个十六进制的两位数。
URL的路径
HTTP协议指定文档路径的方式与操作系统中文件系统指定文件或目录路径的方式类似:都是由目录名称和文件名称组成的一组序列,名称之间通过
分隔符进行分隔,不同的操作系统队友的分隔符也是不一样的。对于UNIX服务器而言,路径是通过“/”隔开的;对于Windows服务器而言,路径是通过“\”
隔开的。绝大多数浏览器都能够接受用户输入不正确的分隔符——例如,在windows服务器中采用“/”作为文档文件路径的分隔符。
URL指定的路径可能与文件路径有所不同,因为URL并不需要包含文件路径中的所有目录。按照顺序包含了所有目录的路径称为完整路径。绝大部分情 况下,服务器配置文件中指定了某个基础路径,URL中的文档路径是相对于该基础路径而指定的。这样的路径称为部分路径。