在基于Java的编程中,经常会碰到汉字的处里及显示的问题,比如一大堆乱码或问号。
  这是因为JAVA中默认的编码方式是UNICODE,而中国人通常使用的文件和DB都是基于GB2312或者UTF-8等编码,故会出现此问题。以前我也经常为这个问题而苦恼,后来经查了些资料,终于解决了,我知道一定有很多朋友也会碰到这个问题,所以特就总结了一下,来拿出来让大家一起分享了。
  1、在网页中输出中文。
  JAVA在网络传输中使用的编码是"ISO-8859-1",故在输出时需要进行转化,如:
  String str="中文";
  str=new String(str.getBytes("GB2312"),"8859_1");
  但假如在编译程序时,使用的编码是“GB2312”,且在中文平台上运行此程序,不会出现此问题,一定要注重。
  2、从参数中读取中文
  这正好与在网页中输出相反如: 如果页面文件采用的是gb2312


             <%@ page contentType="text/html; charset=GBK" %>  后台Java页面如果要得到中文,则:
      str=new String(str.getBytes("8859_1"),"GB2312");


    如果页面采用的文件编码是UTF-8 后台Java如果要得到中文,则:


          str=new String(str.getBytes("8859_1"),"UTF-8");
  3、操作DB中的中文问题
  一个较简单的方法是:在“控制面扳”中,把“区域”设置为“英语(美国)”。假如还会出现乱码,还可进行如下设置:
  取中文时:str=new String(str.getBytes("GB2312"));
  向DB中输入中文:str=new String(str.getBytes("ISO-8859-1"));
  4、在jsp中的中文解决:
  在“控制面扳”中,把“区域”设置为“英语(美国)”.
  在JSP页面中加入:
  假如还不行正常显示,则还要进行下面的转换:
  如:name=new String(name.getBytes("ISO-8859-1"),"GBK");
  就不会出现中文问题了。