Java代码
native2ascii [options] [inputfile [outputfile]]
查官方api文档,命令如下:
官方对参数的解释也清晰简单,这里就不贴原文了,用自己语言描述下:
首先,[oprions],有如下两个命令可以选择:
“-reverse” : 将Latin-1或者Unicode编码转换为本地代码。(就是形如: \u4f60\u597d -->你好 )
“-encoding encoding_name”:将本地编码转换为Latin-1或Unicode编码,如: -encoding gbk
(就是: 你好--》\u4f60\u597d),当然也可跟-reverse命令配合使用, 来指定-reverse 的源文件编码方式。后面具体描述。
其次,[inputfile [outputfile]]
inputfile, 你懂地,输入文件。如果没有输入文件,你在控制台输入点字符串(如果native2ascii无参数执行,则会等待输入)
outputfile,你更懂,输出文件嘛。如果不输的话,它会给你在控制台打出结果。
最后,啥也不说了,来点实际的:
1、将一个全是中文的文本文件 a.txt (内容为:“你好!” ,你可以用其他格式的文件) 转为 Unicode:
Java代码
native2ascii a.txt
(备注:其实是 native2ascii -encoding Unicode a.txt ,因为java默认是unicode编码,故略写了)
2、将中文文件a.txt 转换成Unicode编码后,输出到目标文件b.txt中:
Java代码
native2ascii a.txt b.txt
3、将中文文件转换为其他编码,如通用的 iso8859-1,输出到iso.txt :
Java代码
native2ascii -encoding ISO8859-1 a.txt iso.txt
图3:将中文文件转换为iso8859-1格式
同理,你可以转换为gbk,utf-8等,但在这里的编码必须是支持的编码,了解更多支持的编码请查阅官方文档:
http://download.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html
4、使用-reverse命令,将Unicode编码逆转为本地编码,输出在控制台:
Java代码
native2ascii -reverse b.txt
5、使用-reverse -encoding encoding_name 将其他形式编码转换为本地编码
Java代码
native2ascii -reverse -encoding ISO8859-1 iso.txt
说明: 因为我们在3中使用了-encoding命令来指定输出文件的编码为iso8859-1,就不再是系统默认的Unicode编码了,所以,在要把它转换为本地编码时,需要给它赋编码。如果不给他赋-encoding命令,而直接使用如下命令:
Java代码
native2ascii -reverse iso.txt
我们将看到结果如下:
跟输入文件iso.txt里面的内容一样,没有转换过来。
总结:
要将一个本地编码文件转换为其他格式编码,(形如: 你好 --->\u4f60\u597d )采用
Java代码
native2ascii -encoding encoding_name inputfile
要将其他编码格式的文件转换为本地编码,( 形如:\u4f60\u597d -->你好)采用:
Java代码
native2ascii -reverse -encoding encoding_name inputfile
因为 java 默认是Unicode编码,
故“ native2ascii inputfile” 命令等价于“ native2ascii -encoding Unicode inputfile”,
" native2ascii -reverse inputfile " 等价于 native2ascii -reverse -encoding Unicode inputfile
所以,平时在使用中如果默认的话,都把 -encoding encoding_name 参数省去,以示简洁