编码是信息从一种形式或格式转换为另一种形式的过程,也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。
自己的理解
(简单来说就是每个国家的语言不一样,所以编程时会有语言差异,比如计算机在国外发展的比较早,所以大多数都是英文,如果你打中文在里面就会报错。这时需要让软件识别中文就会用到编码.)
识别中文常用的GB2312,UTF-8.
编码分类
- 汉字区。包括:
a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。
b. GB 13000.1 扩充汉字区。包括:
(1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。
(2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。
CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。 - 图形符号区。包括:
a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,
还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。
b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。 - 用户自定义区:分为(1)(2)(3)三个小区。
(1) AAA1-AFFE,码位 564 个。
(2) F8A1-FEFE,码位 658 个。
(3) A140-A7A0,码位 672 个。
第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。
下面来介绍三种方式如何设置Eclipse的编码格式
第一种:只设置当前*.java文件的编码格式
在当前*.java文件中,按Alt+回车,会出现下图所示界面。可以看到设置编码格式的选项(如图中红色矩形所示)。下拉列表中可以选择想要的编码格式。如果没有,还可以手动输入。设置好之后,点击“Apply”保存设置。点击“OK”关闭菜单。
此种设置编码方式只对当前的单个java文件有效。
第二种:对一个项目工程(Project)设置编码格式选中你的一个项目工程文件,右击会出现如下图所示界面,选择最下面的一个选项"Properties"(图中红色矩形样式),点击进入。
接下来,会进入如下图所示界面,也可以看到设置编码的选项。后续操作和第一种中介绍的方式一样。此种设置编码方式,对一个项目工程的所有文件有效
第三种:对整个工作区间设置编码格式选择“Window”菜单选项,选择“Preference”首选项。(如下图界面所示)
进入之后,在搜索框中输入"enc"(就是英文单词"encoding"),如下图矩形框所示。会看到搜索到的所有选项。如果你一个个单击这项选项,会看到右半部分都有相应的设置编码的选项。
这里以设置工作区间的编码为例。点击“Workspace”,进入如下图所示界面,会看到也有设置编码格式的选项。图中红色矩形框所示。
这种设置编码方式会对整个工作区间中的所有项目文件有效。
记住设置完编码之后,一定要点击“Apply”使设置生效哦。