最近写了一个python代码, 使用PyScripter for Python 2.6 环境(主要是编写方便),用Tkinter写了个小工具,发现中文是乱码。这里要深究一下python的中文表示方法了。
UNICODE (UTF8-16),C854;
2. UTF-8,E59388;
3. GBK,B9FE。
不同见下,unicode是16比特的编码格式,utf-8是八比特。
不同输入下的格式确实不一样。如果需要正确输出汉字,就要和解释器达成一致,咱用的是哪种格式。
在python中提到unicode,一般指的是unicode对象,例如'哈哈'的unicode对象为 u'\u54c8\u54c8' ,还能是gbk
按八比特显示的,除了utf-8之外,还能是gbk、cp936、GB2312。
ok,那在程序前加如下内容:
# -*- coding: utf-8 -*-
咱们都使用utf8字符,问题解决。