1.错误分析及正确方法
原来一直用SQLYog和navicat mysql导入导出,试用的方法均出现丢字,乱码现象。后经过同事指导,发现用工具导入导出的话,假如工具的字符集和目标数据库的字符编码不一致,这样字符会在中间经过2次转换,这样便会出现丢字乱码等现象。后来从命令导入导出,未发现乱码。脚本如下:
mysqldump -h IP -uroot -p密码
--default-character-set=utf8 数据库名称 | mysql -uroot -p密码 --default-character-set=utf8 数据库名称
注:可以在需要导入的数据库上执行上面脚本,字符集是需要导入数据的数据库字符集
2.在服务器的mysql 的配置里需要修改/etc/my.cnf如下:
[client]
default-character-set=utf8
[mysqld]
default-character-set=utf8
此步做完后,可以在目标数据库看到中文字符了,可以进入数据库用select description from 表名 进行查看。
3.在php代码中
在执行SQL语句之前,将MySQL以下三个系统参数设置为与服务器字符集character-set-server相同的字符集。
character_set_client:客户端的字符集。
character_set_results:结果字符集。
character_set_connection:连接字符集。
设置这三个系统参数通过向MySQL发送语句:set names utf8
即在PHP中执行:mysql_query(“set names utf8″);
4.关于GBK、GB2312、UTF8
UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。
GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。
GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:
GBK、GB2312--Unicode--UTF8
UTF8--Unicode--GBK、GB2312