with open(filename) as fp:
dataMat = []
for line in fp.readlines():
# fp.readlines()返回一个list,list of strs
# 也即line类型为`str`
curLine = line.strip().split('\t')
# 只有`str`类型才有strip()成员函数,
# 在经过split()分割,得到list类型
# 也即curLine类型为list
# curLine 仍然是由字符串构成的list
dataMat.extend([float(entry) for entry in curLine])
# 对每一个类型进行强转

文件流成员函数

(1)fp.readlines():返回的是由字符串构成的 list,list of strs(文件中的每一行为一个字符串,划分行的标识是\n(换行符))

(2)str.strip():strip() 是字符串的成员函数,strip()的返回值仍然为字符串

(3)str.split():split() 是字符串的成员函数,返回值是是字符串构成的 list,list of strs

(4)从文件中读取的数据(经过行,再对行切分)都是字符串类型,如果需要转换为数值,需要强制类型转换。

read()、readlines()、readline()

(1)read():读取全部(自然是置于内存中),返回类型为 str

(2)readlines():读取全部行(置于内存中),list of strs(较适合按行迭代)

for line in fp.readlines():
...

# line 中的内容其实就是 readline 的内容

(3)readline():逐行读取,返回类型为 str

while True:
line = fp.readline()
if not line:
break
...

当要读取的文件过大,应优先使用 readline() 逐行读取,出于内存的考虑。

io.UnsupportedOperation: read

也即不支持读操作,为什么 with open() as fp: fp(文件流)却不可以读呢?获取文件的mode(模式)不对,如果设置成了w或者wb,就意味着只写模式。