笔者系统所设的默认编码为utf-8
#!/usr/bin/env python3
# coding=utf-8
中文转unicode
使用字符串的str.encode()方法
s = u"你好"
print(s.encode("unicode_escape"))
>>> b'\\u4f60\\u597d'
unicode转中文
首先使用字符串的str.encode()
方法将字符串转换为raw bytes形式,再调用bytes.decode()
转换为字符串形式
s = r'\u4f60\u597d'
print(s.encode().decode("unicode_escape"))
>>> 你好