3. URI类

URI是对URL的抽象,不仅包括URL还包括URN。
实际使用的URI大多是URL,但是大多数规范和标准都是URI定义的。在Java中这里两个类的主要区别是:
1. URI类完全有关于资源的标识和URI的解析,它没有提供方法来获取URI所标识资源的表示
2. 相比URL,URI类更规范
3. URI对象可以表示相对的URI,URL类在储存URI之前会将其绝对化。

简单的说,URL用于对应网络获取的应用层协议的一个表示,而URI对象纯粹用于解析和处理字符串。
URI类没有网络功能。经过URL类有一些字符串解析方法,但是有很多问题。
URL和URI可以相互转换。

3.1 构造URI

不同于URL,URI不依赖于底层协议构造器。只要URI语法上正确,java就不需要为了创建URI对象而理解其协议。因此不同于URL类,URI可以用于新的实验性的URI模式。

  • 也可以使用其他Union而不仅仅限于ASCII码。
  • 在路径上不用加/

如果你确定语法正确,可以使用create方法创建一个URI。如果这个URI证明不正确,会抛出一个运行时异常。

3.2 URI的各部分

模式:模式特定部分:片段

如果省略模式,这个URI引用则是相对的。
如果省略片段标识符,这个URI引用就是一个纯URI。
URI类提供了一些获取方法,可以泛化各个URI对象的这三个部分。
getRawFoo()返回URI各个部分的编码,
getFoo()首先对所有有用百分号转义的字符进行编码,然后返回编码部分。也就是说%3C会改为<。

每个部分都有对应的get方法。
isOpaque用于判断是否是层次URI

3.3 解析相对URI

publlic URI resolve(URI uri)
publlic URI resolve(String uri)

将uri参数与这个URI进行比较,并用它构造一个新的URI对象,这个对象包装了一个绝对URI。
如果两个都是相对URI则会返回一个新的相对URI作为结果。

public URI relativize(URI uri)

执行相反的操作。从绝对到相对。

3.4 相等性和比较

相等性和散列将如你所愿:

  • 相等的URI必须都是层次的或者不透明的
  • 比较模式和授权机构时不考虑大小写
  • URI其余部分要区分大小写
  • 转义字符在比较前不解码,A和%41是不相等的

URI实现了Comparable接口,可排序,按下列排序:
1. 如果模式不同就比较模式,不考虑大小写
2. 否则,一般认为层次URI小于有相同模式的不透明URI
3. 否则,根据模式特定部分对它们排序。
4. 否则,比较片段
5. 如果两个都是层次URI,根据授权机构排序,授权机构本身根据用户信息、主机、端口排序。主机不区分大小写
6. 否则,就比较路径
7. 否则,比较查询字符串
8. 否则,比较片段。

3.5 字符串表示

toString()返回URI的未编码的字符串形式。没有转义,通常只能用来给人看,不可用来存取数据。
toASCIIString()返回URI的编码字符串形式。总是会完成百分号转义,存取正确的URI