python2默认编码是ASCII,一直到py2.7用的还是ASCII,导致Python只支持英文,想支持其他语言,必须单独配置。

当年在文件开头声明文件的编码才能写中文。如下:

# -*- coding:utf-8 -*-

如果电脑是windows系统,系统默认编码是GBK,声明的时候要声明成GBK,否则依然是乱码,一位内gbk不认识utf-8.

到了python3版本后,终于把默认编码改成了unicode,同时文件存储编码变成了utf-8。不用任何声明就可以写各种语言了。

常用编码介绍:

python2 ascii转 python2 ascii转中文_ico

其中ASCII编码不支持中文。

python2 ascii转 python2 ascii转中文_ico_02

 

 

unicode和任何编码都有映射关系。

 gbk----unicode---utf8