### 英语ASCII编码(1字节),中文gbk编码(2字节) -----> 世界统一unicode编码(两字节)------->utf(英1字节,中文3字节)
### 一个unicode编码可以对应多个国家编码。比如“上”在多个国家编码中都有(日文,中文,繁体),但是unicde编码都是相同的。
### 这样unicode两个字节就可以表示超过65335个字符,表示世界范围内的文字编码。
###
### gbk/utf-8---->decode(解码)----->unicode
### unicode----->encode(编码)------>gbk/utf-8
###
### 文件存用什么编码,读用什么编码
### Notepad++ 在编码菜单下设置存的编码。如果不采用存的编码读就会出现乱码。
### pycharm 在代码中coding:gbk申明是用gbk读,pycharm自动将用gbk存(在pycharm最下面的状态栏显示)。存和读默认是utf-8。
###
### python2 的代码中如果有字符串,字符串就是按照#coding:gbk申明的编码存(比如gbk)。但是不同的终端读采用的编码是不一样的。
### 比如windows cmd是gbk读内容,pycharm终端是utf-8读内容。这样显示python2中的gbk编码字符串,cmd可以正常显示,pycharm终端不能正常显示。
###
### 为了解决终端不能正常显示的问题,python3代码中的字符串都是用unicode编码存。
### 如果用文字用二进制显示,就是bytes类型,是哪种字符编码类型的二进制,用encoding='xxx'(比如utf-8)表示。