最近写了一个python代码, 使用PyScripter for Python 2.6 环境(主要是编写方便),用Tkinter写了个小工具,发现中文是乱码。这里要深究一下python的中文表示方法了。


UNICODE (UTF8-16),C854; 
2. UTF-8,E59388;  
3. GBK,B9FE。

不同见下,unicode是16比特的编码格式,utf-8是八比特。

python字符串utf8编码转换函数 python utf8编码_python

不同输入下的格式确实不一样。如果需要正确输出汉字,就要和解释器达成一致,咱用的是哪种格式。

在python中提到unicode,一般指的是unicode对象,例如'哈哈'的unicode对象为 u'\u54c8\u54c8' ,还能是gbk
按八比特显示的,除了utf-8之外,还能是gbk、cp936、GB2312。

ok,那在程序前加如下内容:

# -*- coding: utf-8 -*-

咱们都使用utf8字符,问题解决。