主要内容:

  • 小目标:掌握字符串
  • 主要内容:字符串类型,编码格式

字符串非常重要,只要做编程,你不可能离开字符串

1.字符串定义方式

字符串是Python中常用,不可变的数据结构

  • 定义方式1:
s1 = "apple"
s2 = 'test'
s3 = """hello"""
  • 字符串定义方式2:str方法
s1 = str(1) #将数字转成字符串

2.字符串类别

  • 普通字符串
s = '普通字符串'
#单引号使用转义符:\\
path = 'e:\\Users'
  • 原字符串 对字符串内容不进行转义
s = r'e:\Users'
  • bytes类型:二进制 一般图片数据等,使用bytes类型;
bs = b'this is test'

3.字符串编解码:

编码格式是python中比较头疼问题,刚入场的同学经常因为编解码问题头大。

  • 不同语言为了在计算机中使用,设计了有不同编码格式,例如:
utf-8:一种通用编码格式
gbk:中文
unicode:通用的编码格式
  • python默认的编码格式:unicode python 中的str类型为unicode字符串,转换成其他编码格式需要编码, 同理,其他语言转成unicode需要解码 看下编解码之间关系:

  • 编码:encode

s = "香蕉"
r = s.encode('utf-8')
r

结果:b'\xe9\xa6\x99\xe8\x95\x89' 注意,这些编码格式都是bytes类型。

  • 解码:decode
r.decode('utf-8')

结果:'香蕉'

注意:编码格式与解码格式必须对应,否则解码错误

r.decode('gbk')

结果:乱码或者异常