浏览器发送的请求参数使用什么编码呢?服务器端获取到发过来的请求参数 默认使用 ISO8859-1进行解码操作,中文一定有乱码问题。
对于Post方式提交的数据,可以使用request.setCharacterEncoding("gb2312");来明确指定获取请求参数时使用编码。但是此种方式只对Post方式提交有效。在这里说明一下,request.setCharacterEncoding("gb2312");对GET方式提交无效的原因是:该代码只设置请求实体的编码,而GET提交的数据是存放在请求行中的[资源名?param1="张三"¶m2=123],所以对GET请求的方式无效。
对于Get方式提交的数据,就只能手动解决乱码:
String newName=newString(name.getBytes("ISO8859-1"),"gb2312");
String user=newString(request.getParameter("user").getBytes("ISO-8859-1"),"UTF-8");
当然,此种方法对Post方式同样有效。
在tomcat的server.xml中可以配置http连接器的URIEncoding可以指定服务器在获取请求参数时默认使用的编码,从而一劳永逸的决绝获取请求参数时的乱码问题。也可以指定useBodyEncodingForURI参数,令request.setCharacterEncoding也对GET方式的请求起作用,但是这俩属性都不推荐使用,因为发布环境往往不允许修改此属性。
我们在servlet中通常会使用到如下几个语句来解决中文乱码问题,下面做一下区分:
request.setCharacterEncoding()是设置从request中取得的值或从数据库中取出的值。
response.setContentType()目的是为了控制浏览器的行为,即控制浏览器用指定编码进行解码(指定HTTP响应的编码,同时指定浏览器显示的编码)。
response.setCharacterEncoding()目的是用于response.getWriter()输出的字符串的乱码问题;如果是response.getOutputStream()是不需要此种解决方案的,因为这句话的意思是为了将response对象中的数据以UTF-8解码后发向浏览器。
response.getOutputStream().write("中文".getBytes())输出数据,这是一个字节流,写入内存使用什么编码,输出就使用什么编码,而浏览器默认用平台字节码打开服务器发送的数据,如果服务器端使用了非平台码去输出字符的字节数据就需要明确的指定浏览器编码时所用的码表,以防止乱码问题。