遇到一个需求,一个接口的调用时,需要将中文转成对应的GBK码,然后发请求调用,大概搜了下,貌似没有简单可行的现成方法,不像python能够直接decode / encode。
找的时候有一个帖子给了启示: java默认用Unicode存储String,所以直接转成某种编码的byte的同时,就已经转成了该编码的encoding。
于是找了个例子,
天安门 对应的gbk码是: %CC%EC%B0%B2%C3%C5
于是转一下
byte[] bytes = source.getBytes("GBK");
再计算下补码(还是反码)神马的。
for(byte b : bytes) {
sb.append("%" + Integer.toHexString((b & 0xff)).toUpperCase());
}
就得到了上述的CC EC B0 B2 C3 C5
按照格式塞进去百分号,大功告成。完整的函数如下:
1 public static String toGBK(String source) throwsUnsupportedEncodingException {2 StringBuilder sb = newStringBuilder();3 byte[] bytes = source.getBytes("GBK");4 for(byteb : bytes) {5 sb.append("%" + Integer.toHexString((b & 0xff)).toUpperCase());6 }7
8 returnsb.toString();9 }