二维数据的格式化和处理单元:
二维数据的表示:
二维数据可视为多条一维数据的集合,当二维数据只有一个元素时,这个二维数据就是一维数据。国际上通用的一维数据和二维数据存储格式为CSV。CSV文件以纯文本形式存储表格数据,文件的每一行对应表格中的一条数据记录,每条记录由一个或多个字段组成,字段之间使用逗号(英文、半角)分隔。因为字段之间可能使用除逗号外的其他分隔符,所以CSV也称为字符分隔值。
二维数据一般是一种表格形式,由于它的每一行具有相同的格式特点,一般我们采用(列表类型来表达二维数据)
使用列表类型
使用二维列表,本身是一个列表,而列表中的每一个元素又是一个列表,其中每一个元素可以代表二维数据的一行或者一列。若干行和若干列组织起来的外围列表就构成了我们所说的二维列表。
表达二维数据采用二维列表。
用二维列表表达二维数据,进一步我们可以使用两层for循环遍历每一个元素
[[3.1398,3.1349,3.1376] ,
[3.1398,3.1349,3.1376]]
使用两层for循环遍历每个元素
第一层for循环遍历列表的每个元素,每个元素又是一个列表,所以需要再一次的for循环去遍历其中的元素,所以说两层for循环。
外层列表中每个元素可以对应一行,也可以对应一列。
数据维度是数据的组织形式
一维数据:列表和集合类型
[3.1398,3.1349,3.1376] 数据间有序
{3.1398,3.1349,3.1376} 数据间无序
二维数据:列表类型
[[3.1398,3.1349,3.1376] ,
[3.1398,3.1349,3.1376]]
CSV格式与二维数据的存储:
csv:comma-separated values(由逗号分割的值)
用逗号来分隔值是国际通用的一二维数据存储格式,一般.csv扩展名
每行一个一维数据,采用逗号分隔,无空行
Excel和一般编辑软件都可以读入或另存为CSV文件
CSV格式是数据转换之间的通用的标准格式
北京 | 101.5 | 120.5 |
上海 | 101.2 | 127.3 |
北京,101.5,120.5
上海,101.2,127.3
CSV广泛应用于不同体系结构下网络应用程序之间表格信息的交换中,它本身并无明确格式标准,具体标准一般由传输双方协商决定。
如果某个元素缺失,逗号仍要保留
二维数据的表头可以作为数据存储,也可以另行存储
逗号为英文半角符号,逗号与数据之间无额外空格
数据中出现一个逗号,增加两个引号,增加一个转义符。
二维数据:
按行存或者按列存都可以,具体由程序决定。
一般索引习惯:ls[row][column],先行后列
根据一般习惯,外层列表每个元素是一行,按行存。
二维数据的处理:
从csv格式的文件中读入数据:
文件如下所示:
示例代码如下:
fo=open("rgf","r",encoding="utf-8") ls=[] for line in fo: line=line.replace("\n"," ") ls.append(line.split(",")) print(ls) fo.close()
运行界面如图:
将数据写入csv格式的文件:
代码示例如下:
ls=[[],[],[]] #二维列表 f=open("rgf","w",encoding="utf-8") for item in ls: f.write(','.join(item)+'\n') f.close()
运行界面如下:
二维数据的逐一处理:
利用二层循环:
示例代码如下:
ls=[[1,2],[3,4],[5,6]] for row in ls: for column in row: print(column) print(ls)
运行界面如下:
多维数据的格式化:
二维数据是一维数据的集合,依此类推,三维数据是二维数据的集合,四维数据是三维数据的集合。按照此种层层嵌套的方式组织数据,多维数据的表示会非常复杂。为了直观地表示多维数据,也为了方便组织和操作多维数据,三维及以上的多维数据统一采用键值对的形式进行格式化。
网络平台上传递的数据大多是高维数据,网络中常见的高维数据格式---JSON是一种轻量级的数据交换格式,本质上是一种被格式化的字符串,既易于人们阅读和编写,也易于机器解析和生成。JSON语法是Javascript语法的子集,JavaScript语言中一切都是对象,因此JSON也以对象的形式表示数据。
JSON格式的数据遵循以下语法规则:
(1)数据存储在键值对(key:value)中
(2)数据的字段由逗号分隔
(3)一个大括号保存一个JSON对象{ }
(4)一个中括号保存一个数组[ ]
除JSON外,网络平台也会使用XML(可扩展标记语言)、HTML等格式组织多维数据,XML和HTML格式通过标签组织数据。
对比JSON格式与XML、HTML格式可知,JSON格式组织的多维数据更为直观,且数据属性的key只需存储一次,在网络中进行数据交换时耗费的流量更少。