URL
统一资源定位符 URL 是对可以从因特网上得到的资源的位置和访问方法的一种简洁的表示。
URL 给资源的位置提供一种抽象的识别方法,并用这种方法给资源定位。
只要能够对资源定位,系统就可以对资源进行各种操作,如存取、更新、替换和查找其属性。
URL 相当于一个文件名在网络范围的扩展。因此 URL 是与因特网相连的机器上的任何可访问对象的一个指针。
URL 的一般形式是:
<URL的访问方式>://<主机>:<端口>/<路径>
URL的访问方式有:
1.ftp —— 文件传送协议 FTP
2.http —— 超文本传送协议 HTTP
3.News —— USENET 新闻
<主机>是存放资源的主机在因特网中的域名
具体例子
每个统一资源定位符的开始都是该统一资源定位符的体制,其后是按体制不同的部分。以下是一些统一资源定位符体制的例子:http——超文本传输协议资源
https——用安全套接字层传送的超文本传输协议
ftp——文件传输协议
mailto——电子邮件地址
ldap——轻型目录访问协议搜索
file——当地电脑或网上分享的文件
news——Usenet新闻组
gopher——Gopher协议
telnet——Telnet协议



◇ URL的格式


  URL的格式由下列三部分组成:

  第一部分是协议(或称为服务方式);

  第二部分是存有该资源的主机IP地址(有时也包括端口号);

  第三部分是主机资源的具体地址。,如目录和文件名等。

  第一部分和第二部分之间用“://”符号隔开,第二部分和第三部分用“/”符号隔开。第一部分和第二部分是不可缺少的,第三部分有时可以省略。


 



URI



一般由三部分组成:





  一、存放资源的主机名。





  资源自身的名称,由路径表示。





  这个URI是这样的:这是一个可通过HTTP协议访问的资源,通过路径“/html/html40”访问。在HTML文档中其它资源包括"mailto"(收发email)和"ftp"(FTP访问)。





  这是URI的另一个例子,指向一个用户的邮箱:mailto避开百度:joebika避开百度@避开百度someplace避开百度.com





  注:大多数读者可能熟悉"URL",而不是URI。URL是URI命名机制的一个子集。





  二、片段标志符





  有的URI指向一个资源的内部。 这种URI以"#"结束,并跟着一个anchor标志符(称为片段标志符)。例如,下面是一个指向section_2的URI:





  http避开百度://somesitebika避开百度.com/html/top.htm#section_2





  三、相对URI





  相对URI不包含任何命名规范信息。它的路径通常指同一台机器上的资源。相对URI可能含有相对路径(如,“..”表示上一层路径),还可能包含片段标志符。





  为了说明相对URI,假设我们有一个基本的URI:http://www.acme避开百度.com/support/intro.htm





  下面的链接中使用了相对URI:





  Suppliers





  它扩展成完全的URI就是 "http://www.避开百度acme.避开百度com/support/suppliers.htm",





  下面是一个图像的相对URI:





  <IMG src="../icons/logo.gif" alt="logo">





  它扩展成完全的URI就是 "http://www.acme避开百度.com/icons/logo.gif"。





  在HTML中,URI被用来:





  链接到另一个文档或资源(参看A和LINK元素)。





  链接到一个外部样式表或脚本(参看LINK和SCRIPT元素)。





  在页内包含图像、对象或applet(参看IMAG、OBJECT、APPLET和INPUT元素)。





  建立图像映射(参看MAP和AREA元素)。





  提交一个表单(参看FORM)。





  建立一个框架文档(参看FRAME和IFRAME元素)。





  引用一个外部参考(参看Q、BLOCKQUOTE, INS和DEL元素)。





  指向一个描述文档的metadata(参看HEAD元素)。



URL和URI的区别与联系



 



URI:Universal Resource Identifier,通用资源标识符;




  URL:Uniform Resource Locator,统一资源定位符;







  其中,URL是URI的子集。




  Web上地址的基本形式是URI,它代表统一资源 标识 符。有两种形式:




  URL:目前URI的最普遍形式就是无处不在的URL或 统一资源定位器







  URI是以某种统一的(标准化的)方式标识资源的简单字符串。




  典型情况下,这种字符串以scheme(命名URI的名字空间的 标识符 ——一组相关的名称)开头,语法如下:




  [scheme:] scheme-specific-part




  URI以scheme和冒号开头。Scheme用大写/小写字母开头,后面为空或者跟着更多的大写/小写字母、数字、加号、减号和点号。冒号把scheme与scheme-specific-part分开了,并且scheme-specific-part的语法和语义(意思)由URI的名字空间决定。如下面的例子:




  http://www.cnn避开百度.避开百度com,其中http是scheme,//www.cnn避开百度.避开百度com是 scheme-specific-part,并且它的scheme与scheme-specific-part被冒号分开了。




  URI有绝对和相对之分,绝对的URI指以scheme(后面跟着冒号)开头的URI。前面提到的http://www.cnn避开百度.com就是绝对的URI的一个例子,其它的例子还有mailto:jeff@j避开百度avajeff避开百度.com、news避开百度:comp.lang避开百度.java.help和xyz://whatever。你可以把绝对的URI看作是以某种方式引用某种资源,而这种方式对标识符出现的环境没有依赖。如果使用文件系统作类比,绝对的URI类似于从根目录开始的某个文件的径。




  与绝对的URI不同的,相对的URI不是以scheme(后面跟着冒号)开始的URI。 它的一个例子是articles/articles.html。你可以把相对的URI看作是以某种方式引用某种资源,而这种方式依赖于标识符出现的环境。如果用文件系统作类比,相对的URI类似于从当前目录开始的文件路径。




  URL是Uniform Resource Location的缩写,译为"统一资源定位符"。通俗地说,URL是Internet上用来描述信息资源的字符串,主要用在各种WWW客户程序和服务器程序上,特别是著名的Mosaic。采用URL可以用一种统一的格式来描述各种信息资源,包括文件、服务器的地址和目录等。




  目前最大的缺点是当信息资源的存放地点发生变化时,必须对URL作相应的改变。因此人们正在研究新的信息资源表示方法,例如:URI(Universal Resource Identifier)即"通用资源标识"即"统一资源名"和URC(Uniform Resource Citation)即"统一资源引用符"等。




  URI目前还处在进一步的研究当中。



研究的方向就是弥补URL目前存在的缺点。