二维数据的格式化和处理单元:

二维数据的表示:

二维数据可视为多条一维数据的集合,当二维数据只有一个元素时,这个二维数据就是一维数据。国际上通用的一维数据和二维数据存储格式为CSV。CSV文件以纯文本形式存储表格数据,文件的每一行对应表格中的一条数据记录,每条记录由一个或多个字段组成,字段之间使用逗号(英文、半角)分隔。因为字段之间可能使用除逗号外的其他分隔符,所以CSV也称为字符分隔值。

二维数据一般是一种表格形式,由于它的每一行具有相同的格式特点,一般我们采用(列表类型来表达二维数据)

使用列表类型

使用二维列表,本身是一个列表,而列表中的每一个元素又是一个列表,其中每一个元素可以代表二维数据的一行或者一列。若干行和若干列组织起来的外围列表就构成了我们所说的二维列表。

表达二维数据采用二维列表。

用二维列表表达二维数据,进一步我们可以使用两层for循环遍历每一个元素

[[3.1398,3.1349,3.1376] ,

[3.1398,3.1349,3.1376]]

使用两层for循环遍历每个元素

第一层for循环遍历列表的每个元素,每个元素又是一个列表,所以需要再一次的for循环去遍历其中的元素,所以说两层for循环。

外层列表中每个元素可以对应一行,也可以对应一列。

数据维度是数据的组织形式

一维数据:列表和集合类型

[3.1398,3.1349,3.1376] 数据间有序

{3.1398,3.1349,3.1376} 数据间无序

二维数据:列表类型

[[3.1398,3.1349,3.1376] ,

[3.1398,3.1349,3.1376]]

CSV格式与二维数据的存储:

csv:comma-separated values(由逗号分割的值)

用逗号来分隔值是国际通用的一二维数据存储格式,一般.csv扩展名

每行一个一维数据,采用逗号分隔,无空行

Excel和一般编辑软件都可以读入或另存为CSV文件

CSV格式是数据转换之间的通用的标准格式

北京

101.5

120.5

上海

101.2

127.3

北京,101.5,120.5

上海,101.2,127.3

CSV广泛应用于不同体系结构下网络应用程序之间表格信息的交换中,它本身并无明确格式标准,具体标准一般由传输双方协商决定。

如果某个元素缺失,逗号仍要保留

二维数据的表头可以作为数据存储,也可以另行存储

逗号为英文半角符号,逗号与数据之间无额外空格

数据中出现一个逗号,增加两个引号,增加一个转义符。

二维数据:

按行存或者按列存都可以,具体由程序决定。

一般索引习惯:ls[row][column],先行后列

根据一般习惯,外层列表每个元素是一行,按行存。

二维数据的处理:

从csv格式的文件中读入数据:

文件如下所示:

二维三维数据集深度学习 二维的数据_python

示例代码如下:


fo=open("rgf","r",encoding="utf-8") ls=[] for line in fo: line=line.replace("\n"," ") ls.append(line.split(",")) print(ls) fo.close()


运行界面如图:

二维三维数据集深度学习 二维的数据_后端_02

 将数据写入csv格式的文件:

代码示例如下:


ls=[[],[],[]] #二维列表 f=open("rgf","w",encoding="utf-8") for item in ls: f.write(','.join(item)+'\n') f.close()


运行界面如下:

二维三维数据集深度学习 二维的数据_二维_03

二维数据的逐一处理:

利用二层循环:

示例代码如下:


ls=[[1,2],[3,4],[5,6]] for row in ls: for column in row: print(column) print(ls)


运行界面如下:

二维三维数据集深度学习 二维的数据_二维三维数据集深度学习_04

多维数据的格式化:

二维数据是一维数据的集合,依此类推,三维数据是二维数据的集合,四维数据是三维数据的集合。按照此种层层嵌套的方式组织数据,多维数据的表示会非常复杂。为了直观地表示多维数据,也为了方便组织和操作多维数据,三维及以上的多维数据统一采用键值对的形式进行格式化。

网络平台上传递的数据大多是高维数据,网络中常见的高维数据格式---JSON是一种轻量级的数据交换格式,本质上是一种被格式化的字符串,既易于人们阅读和编写,也易于机器解析和生成。JSON语法是Javascript语法的子集,JavaScript语言中一切都是对象,因此JSON也以对象的形式表示数据。

JSON格式的数据遵循以下语法规则:

(1)数据存储在键值对(key:value)中

(2)数据的字段由逗号分隔

(3)一个大括号保存一个JSON对象{  }

(4)一个中括号保存一个数组[  ]

除JSON外,网络平台也会使用XML(可扩展标记语言)、HTML等格式组织多维数据,XML和HTML格式通过标签组织数据。

对比JSON格式与XML、HTML格式可知,JSON格式组织的多维数据更为直观,且数据属性的key只需存储一次,在网络中进行数据交换时耗费的流量更少。