在网络请求中如果URL中存在特殊字符会报语法错误,比如“java.net.URISyntaxException: Malformed escape pair at index”。这是因为在你的URL中包含了特殊字符,因为只有字母和数字[0-9a-zA-Z]、一些特殊符号“$-_.+!*’(),”[不包括双引号]、以及某些保留字,才可以不经过编码直接用于URL。

url中的特殊字符

在URL参数中的特殊字符需要进行编码后传递,编码规则是“%+字符的ASCII码十六进制”,对应下表

特殊字符

编码

空格

%20

"

%22

#

%23

%

%25

&

%26

(

%28

)

%29

+

%2B

,

%2C

/

%2F

:

%3A

;

%3B

<

%3C

=

%3D

>

%3E

?

%3F

@

%40

\

%5C

竖线

%7C

java中对含有特殊字符的URL参数编码方法

在java中提供了api对URL中的特殊字符编码
URLEncoder.encode(paramString, “utf-8”)
如果需求是存在一个URL,并且URL参数中存在特殊字符,需要对该URL发送get请求,那么就需要先将这个URL的参数部分进行编码,那么URL的参数部分应该如何拆分出来,我们先来了解一下URL的结构。

protocol(协议)

指定使用的传输协议,下表列出 protocol 属性的有效方案名称。 最常用的是HTTP协议,它也是目前WWW中应用最广的协议。
file 资源是本地计算机上的文件。格式file:///,注意后边应是三个斜杠。
ftp 通过 FTP访问资源。格式 FTP://
gopher 通过 Gopher 协议访问该资源。
http 通过 HTTP 访问该资源。 格式 HTTP://
https 通过安全的 HTTPS 访问该资源。 格式 HTTPS://
mailto 资源为电子邮件地址,通过 SMTP 访问。 格式 mailto:
MMS 通过 支持MMS(流媒体)协议的播放该资源。(代表软件:Windows Media Player)格式 MMS://
ed2k 通过 支持ed2k(专用下载链接)协议的P2P软件访问该资源。(代表软件:电驴) 格式 ed2k://
Flashget 通过 支持Flashget:(专用下载链接)协议的P2P软件访问该资源。(代表软件:快车) 格式 Flashget://
thunder 通过 支持thunder(专用下载链接)协议的P2P软件访问该资源。(代表软件:迅雷) 格式 thunder://
news 通过 NNTP 访问该资源。

hostname(主机名)

是指存放资源的服务器的域名系统(DNS) 主机名或 IP 地址。有时,在主机名前也可以包含连接到服务器所需的用户名和密码(格式:username:password@hostname)。

port(端口号)

整数,可选,省略时使用方案的默认端口,各种传输协议都有默认的端口号,如http的默认端口为80。如果输入时省略,则使用默认端口号。有时候出于安全或其他考虑,可以在服务器上对端口进行重定义,即采用非标准端口号,此时,URL中就不能省略端口号这一项。

path(路径)

由零或多个“/”符号隔开的字符串,一般用来表示主机上的一个目录或文件地址。

parameters(参数)

这是用于指定特殊参数的可选项。

query(查询)

可选,用于给动态网页(如使用CGI、ISAPI、PHP/JSP/ASP/ASP。NET等技术制作的网页)传递参数,可有多个参数,用“&”符号隔开,每个参数的名和值用“=”符号隔开。

fragment(信息片断)

字符串,用于指定网络资源中的片断。例如一个网页中有多个名词解释,可使用fragment直接定位到某一名词解释。(from 百度百科
举个栗子
http: // 192.2.111.33:80/app/index?type=1&name=%%admin

protocol

hostname

port

path

query

http://

192.2.111.33

80

/app/index

type=1&name=%%admin

java中如果请求参数部分存在特殊字符,那么应该怎么处理:
拆分参数部分–>转义编码–>组装URL
1.将请求参数分割

int index = url.indexOf("?");
  if (index < 0) return url;
  String query = url.substring(0, index);
  String params = url.substring(index + 1);

2.将params转化成数组

String[] param_pairs = params.split("&");

param_pairs 数组是这样的[“type=1”,“name=%%admin”]我们需要得到参数的value部分进行编码,所以还要继续把value拆分出来

int length = param_pairs.length;
  for (int i = 0; i < length; i++) {
          int pos = param_pairs[i].indexOf("=");
          if (pos == -1) continue;
          String name = param_pairs[i].substring(0, pos);
          String value = param_pairs[i].substring(pos + 1);
      }

3.用URLEncoder.encode()函数进行参数部分的编码

int length = param_pairs.length;
  for (int i = 0; i < length; i++) {
          int pos = param_pairs[i].indexOf("=");
          if (pos == -1) continue;
          String name = param_pairs[i].substring(0, pos);
          String value = param_pairs[i].substring(pos + 1);
          value = URLEncoder.encode(value, "utf-8");
          map.put(name, value);
      }

4.URL的重新组装
以上已经将参数部分转化称map形式,那么重组只需要便利map取出name和value并以“=”连接,每组间以“&”连接就得到了参数部分,再以“?”连接上面的query和新的参数部分。
完整代码:

public static String getUrl(String url) {
     int index = url.indexOf("?");
     if (index < 0)
         return url;
     String query = url.substring(0, index);
     String params = url.substring(index + 1);
     Map map = new HashMap();
     String[] param_pairs = params.split("&");
     try {
         for (int i = 0; i < param_pairs.length; i++) {
             int pos = param_pairs[i].indexOf("=");
             if (pos == -1)
                 continue;
             String name = param_pairs[i].substring(0, pos);
             String value = param_pairs[i].substring(pos + 1);
             value = URLEncoder.encode(value, "utf-8");
             map.put(name, value);
         }
     } catch (UnsupportedEncodingException e) {
         e.printStackTrace();
     }
     StringBuilder encodeParams = new StringBuilder();
     java.util.Map.Entry entry;
     for (Iterator iterator = map.entrySet().iterator(); iterator.hasNext(); ) {
         entry = (java.util.Map.Entry) iterator.next();
         encodeParams.append(entry.getKey().toString()).append("=")
                 .append(null == entry.getValue() ? "" : entry.getValue().toString())
                 .append(iterator.hasNext() ? "&" : "");
     }
     return query + "?" + encodeParams.toString();
 }

转化结果
http:// 192.2.111.33:80/app/index?type=1&name=%25%25admin