前段时间在跨版本迁移MySQL数据的时候总是越到乱码问题,现总结一下。

    思想:数据乱码其实就是数据在写入时和读出时使用了不同的字符编码规则,解决乱码也就是统一字符编码规则,也叫统一字符集。比如数据库表使用ascii编码存储数据,而在插入或读取数据时使用gb2312一定会出乱码。

    在MySQL中字符集是多层继承的,MySQL默认字符集——>数据库字符集——>表字符集。在创建数据库时若未指定数据库字符集,则新建的库继承MySQL默认字符集,同样,若新建表未指定字符集则继承所属的数据库字符集。在新搭建一台MySQL服务时一定要提前设定好默认字集,MySQL默认为latin1,为了兼容多国语言推荐使用utf8。


查看当前MySQL支持的字符集:

MySQL [(none)]> SHOW charset;

关于MySQL乱码问题总结_mysql


MySQL默认字符集指定方法:

 修改my.cnf配置文件:           

 [mysqld]
 default-character-set=utf8        #适用于5.1及以前版本
 character-set-server=utf8        #适用于5.5版本

  

 检查当前字符集设置:        

SHOW VARIABLES LIKE 'character%';

 character_set_client: 客户端。由配置文件中的default-character-set指定,若不指定则会读取当前shell终端的字符集,并保持与之保持一直。

 character_set_connection:当前连接。当客户端和服务器字符集不同时以此连接为准。由配置文件中的default-character-set指定,若不指定则会读取当前shell终端的字符集,并保持与之保持一直。

 character_set_database: 数据库字符集。由配置文件指定或建库建表时指定。由服务器端参数character_set_server指定

 character_set_filesystem: 字符集文件系统

 character_set_results: 返回结果。由配置文件中的default-character-set指定,若不指定则会读取当前shell终端的字符集,并保持与之保持一直。

 character_set_server: 服务器字符集,配置文件指定或建库建表指定。由服务器端参数character_set_server指定

 默认情况下character_set_client、character_set_connection和character_set_results与系统的字符集一致(/etc/sysconfig/i18n)。


 查询数据时乱码:

 1、在查询数据时乱码时首先要先查询出当前数据库乃至表的当前字符编码,命令如下:

  SHOW CREATE DATABASE DatabaseName;        #查询数据库编码规则

  SHOW CREATE TABLE DatabaseName.TableName;    #查询表的编码规则

 2、根据库或表的编码所用字符集修改SELECT查询时反馈数据的编码字符集: 

SET NAMES CharacterSet;    #设定NAMES值,此命令会同时修改character_set_client、character_set_connection和character_set_results。此设置临时生效。

  或修改my.cnf配置文件:

[client]
default-character-set=CharacterSet        #配置文件中修改永久生效


 插入数据后乱码:

  在拷入数据时同查询时一样,首先要保证写入数据时的编码同表的编码规则一致。可通过修改NAMES实现。或使用脚本导入时指定编码,以gb2312为例:

SET NAMES gb2312;

 或:

mysql --default-character-set=gb2312 DatabaseName < DatabaseName.sql


 迁移数据:

  若要从一个MySQL服务器中将数据迁移至另一台MySQL服务器,可通过mysqldump导出数据,将数据拷贝至新服务器后再导入。

   1、在导出数据前一定要查看预导出数据库表的编码规则:

    SHOW CREATE TABLE DatabaseName.TableName; 

   2、依据该规则指定字符集导出:

    mysqldump -hHostIP -uUsername -p --default-character-set=CharacterSet DatabaseName > DatabaseName.sql

   3、数据拷贝至新服务器后,在导入时指定新数据库表的字符集:

    mysql --default-character-set=NewCharacterSet DatabaseName < DatabaseName.sql

    注意:

    1)在新MySQL服务器中导入数据前要注意检查DatabaseName.sql脚本文件中指定的存储引擎和字符集是否与新服务器一致,若不一致可使用sed命令修改;

    2)mysqldump导出的脚本文件中没有新建数据库,需要提前手工创建数据库,并在导入时指定该数据库;


Example:

mysqldump --default-character-set=binary jicheng > binary-jicheng.sql
scp binary-jicheng.sql root@www.oimec.cn:/media/data/importing/wwwDB/jicheng/
sed -i 's/ ENGINE=MyISAM DEFAULT CHARSET=latin1//g' binary-jicheng.sql
CREATE DATABASE jicheng DEFAULT CHARACTER SET gb2312;
SHOW CREATE DATABASE jicheng;
mysql --default-character-set=gb2312 jicheng < binary-jicheng.sql


--需存储为utf8,需再次导出数据,并在创建表时指定DEFAULT CHARSET=utf8