Numpy 中包含了一些函数用于处理数组,大致如下:
1、修改数组形状
reshape 不改变数据的条件下修改形状, numpy.reshape(arr, newshape, order='C')
-
arr
:要修改形状的数组 -
newshape
:整数或者整数数组,新的形状应当兼容原有形状 - order:'C' -- 按行,'F' -- 按列,'A' -- 原顺序,'k' -- 元素在内存中的出现顺序、
>>> import numpy as np
>>> a = np.arange(8)
>>> print(a)
[0 1 2 3 4 5 6 7]
>>> a.reshape(2,4)
array([[0, 1, 2, 3],
[4, 5, 6, 7]])
>>> a.reshape(4,2)
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
flat 数组元素迭代器
>>> a = np.arange(9).reshape(3,3)
>>> for row in a:
print (row)
[0 1 2]
[3 4 5]
[6 7 8]
#对数组中每个元素都进行处理,可以使用flat属性,该属性是一个数组元素迭代器:
>>> for element in a.flat:
print (element)
0
1
2
3
4
5
6
7
8
flatten 返回一份数组拷贝,对拷贝所做的修改不会影响原始数组
- order:'C' -- 按行,'F' -- 按列,'A' -- 原顺序,'K' -- 元素在内存中的出现顺序。
>>> a = np.arange(8).reshape(2,4)
>>> print(a)
[[0 1 2 3]
[4 5 6 7]]
# 默认按行
>>> print(a.flatten())
[0 1 2 3 4 5 6 7]
#以F风格
>>> print(a.flatten(order = 'F'))
[0 4 1 5 2 6 3 7]
#以C风格
>>> print(a.flatten(order = 'C'))
[0 1 2 3 4 5 6 7]
ravel 返回展开数组
numpy.ravel() 展平的数组元素,顺序通常是"C风格",返回的是数组视图(view,有点类似 C/C++引用reference的意味),修改会影响原始数组。
该函数接收两个参数:
numpy.ravel(a, order='C')
- order:'C' -- 按行,'F' -- 按列,'A' -- 原顺序,'K' -- 元素在内存中的出现顺序。
>>> a = np.arange(8).reshape(2,4)
>>> a
array([[0, 1, 2, 3],
[4, 5, 6, 7]])
# 默认按行
>>> print(a.ravel())
[0 1 2 3 4 5 6 7]
>>> print(a.ravel(order = 'F'))
[0 4 1 5 2 6 3 7]
2、翻转数组
transpose 对换数组的维度
numpy.transpose(arr, axes)
-
arr
:要操作的数组 -
axes
:整数列表,对应维度,通常所有维度都会对换
>>> a = np.arange(12).reshape(3,4)
>>> a
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
>>> print(np.transpose(a))
[[ 0 4 8]
[ 1 5 9]
[ 2 6 10]
[ 3 7 11]]
>>>
ndarray.T 和 self.transpose() 相同
>>> a = np.arange(12).reshape(3,4)
>>> a
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
>>> a.T
array([[ 0, 4, 8],
[ 1, 5, 9],
[ 2, 6, 10],
[ 3, 7, 11]])
rollaxis 向后滚动指定的轴
numpy.rollaxis(arr, axis, start)
参数说明:
-
arr
:数组 -
axis
:要向后滚动的轴,其它轴的相对位置不会改变 -
start
:默认为零,表示完整的滚动。会滚动到特定位置。
>>> a = np.arange(8).reshape(2,2,2)
>>> a
array([[[0, 1],
[2, 3]],
[[4, 5],
[6, 7]]])
>>> print (a)
[[[0 1]
[2 3]]
[[4 5]
[6 7]]]
>>> print(np.where(a==6))
(array([1], dtype=int32), array([1], dtype=int32), array([0], dtype=int32))
>>> print(a[1,1,0]) # 为 6
6
>>> print(np.where(a==0))
(array([0], dtype=int32), array([0], dtype=int32), array([0], dtype=int32))
>>> print(np.where(a==1))
(array([0], dtype=int32), array([0], dtype=int32), array([1], dtype=int32))
>>> print(np.where(a==2))
(array([0], dtype=int32), array([1], dtype=int32), array([0], dtype=int32))
>>> print(np.where(a==3))
(array([0], dtype=int32), array([1], dtype=int32), array([1], dtype=int32))
>>> print(np.where(a==4))
(array([1], dtype=int32), array([0], dtype=int32), array([0], dtype=int32))
>>> print(np.where(a==5))
(array([1], dtype=int32), array([0], dtype=int32), array([1], dtype=int32))
>>> print(np.where(a==6))
(array([1], dtype=int32), array([1], dtype=int32), array([0], dtype=int32))
>>> print(np.where(a==7))
(array([1], dtype=int32), array([1], dtype=int32), array([1], dtype=int32))
# 将轴 2 滚动到轴 0(宽度到深度)
>>> b = np.rollaxis(a,2,0)
>>> print (b)
[[[0 2]
[4 6]]
[[1 3]
[5 7]]]
>>> print(np.where(b==6))
(array([0], dtype=int32), array([1], dtype=int32), array([1], dtype=int32))
# 将轴 2 滚动到轴 1:(宽度到高度)
>>> c = np.rollaxis(a,2,1)
>>> print (c)
[[[0 2]
[1 3]]
[[4 6]
[5 7]]]
# 查看元素 a[1,1,0],即 6 的坐标,变成 [1, 0, 1]
# 最后的 0 和 它前面的 1 对换位置
>>> print(np.where(c==6))
(array([1], dtype=int32), array([0], dtype=int32), array([1], dtype=int32))
swapaxes 对换数组的两个轴
numpy.swapaxes(arr, axis1, axis2)
-
arr
:输入的数组 -
axis1
:对应第一个轴的整数 -
axis2
:对应第二个轴的整数
>>> a = np.arange(8).reshape(2,2,2)
>>> print (a)
[[[0 1]
[2 3]]
[[4 5]
[6 7]]]
# 现在交换轴 0(深度方向)到轴 2(宽度方向)
>>> print (np.swapaxes(a, 2, 0))
[[[0 4]
[2 6]]
[[1 5]
[3 7]]]
3、修改数组维度
broadcast 产生模仿广播的对象,它返回一个对象,该对象封装了将一个数组广播到另一个数组的结果。
该函数使用两个数组作为输入参数,如下实例:
>>> x = np.array([[1], [2], [3]])
>>> y=np.array([4,5,6])
>>> b = np.broadcast(x,y)
>>> r,c = b.iters
>>> print (next(r), next(c))
1 4
>>> print (next(r), next(c))
1 5
>>> print (next(r), next(c))
1 6
>>> print (next(r), next(c))
2 4
>>> print (next(r), next(c))
2 5
>>> print (next(r), next(c))
2 6
>>> print (next(r), next(c))
3 4
>>> print (next(r), next(c))
3 5
>>> print (next(r), next(c))
3 6
>>> print (b.shape)
(3, 3)
>>> b = np.broadcast(x,y)
>>> c = np.empty(b.shape)
>>> print (c.shape)
(3, 3)
>>> c.flat = [u + v for (u,v) in b]
>>> print (c)
[[5. 6. 7.]
[6. 7. 8.]
[7. 8. 9.]]
>>> print (x + y)
[[5 6 7]
[6 7 8]
[7 8 9]]
broadcast_to 函数将数组广播到新形状。它在原始数组上返回只读视图。 它通常不连续。 如果新形状不符合 NumPy 的广播规则,该函数可能会抛出ValueError。
numpy.broadcast_to(array, shape, subok)
>>> import numpy as np
>>> a = np.arange(4).reshape(1,4)
>>> a
array([[0, 1, 2, 3]])
>>> print (np.broadcast_to(a,(4,4)))
[[0 1 2 3]
[0 1 2 3]
[0 1 2 3]
[0 1 2 3]]
expand_dims 函数通过在指定位置插入新的轴来扩展数组形状,函数格式如下:
numpy.expand_dims(arr, axis)
参数说明:
-
arr
:输入数组 -
axis
:新轴插入的位置
>>> x = np.array(([1,2],[3,4]))
>>> x
array([[1, 2],
[3, 4]])
>>> y = np.expand_dims(x, axis = 0)
>>> y
array([[[1, 2],
[3, 4]]])
>>> print (x.shape, y.shape)
(2, 2) (1, 2, 2)
>>> y = np.expand_dims(x, axis = 1)
>>> print (y)
[[[1 2]]
[[3 4]]]
>>> print (x.ndim,y.ndim)
2 3
>>> print (x.shape, y.shape)
(2, 2) (2, 1, 2)
squeeze 从数组的形状中删除一维条目
numpy.squeeze(arr, axis)
-
arr
:输入数组 -
axis
:整数或整数元组,用于选择形状中一维条目的子集
>>> x = np.arange(9).reshape(1,3,3)
>>> x
array([[[0, 1, 2],
[3, 4, 5],
[6, 7, 8]]])
>>> y = np.squeeze(x)
>>> y
array([[0, 1, 2],
[3, 4, 5],
[6, 7, 8]])
>>> print (x.shape, y.shape)
(1, 3, 3) (3, 3)
4、连接数组
concatenate 连接沿现有轴的数组序列
numpy.concatenate((a1, a2, ...), axis)
-
a1, a2, ...
:相同类型的数组 -
axis
:沿着它连接数组的轴,默认为 0
>>> a = np.array([[1,2],[3,4]])
>>> a
array([[1, 2],
[3, 4]])
>>> b = np.array([[5,6],[7,8]])
>>> print (np.concatenate((a,b)))
[[1 2]
[3 4]
[5 6]
[7 8]]
>>> print (np.concatenate((a,b),axis = 1))
[[1 2 5 6]
[3 4 7 8]]
stack 沿着新的轴加入一系列数组。
numpy.stack(arrays, axis)
-
arrays
相同形状的数组序列 -
axis
:返回数组中的轴,输入数组沿着它来堆叠
>>> import numpy as np
>>> a = np.array([[1,2],[3,4]])
>>> print (a)
[[1 2]
[3 4]]
>>> b = np.array([[5,6],[7,8]])
>>> b
array([[5, 6],
[7, 8]])
>>> print (np.stack((a,b),0))
[[[1 2]
[3 4]]
[[5 6]
[7 8]]]
>>> print (np.stack((a,b),1))
[[[1 2]
[5 6]]
[[3 4]
[7 8]]]
hstack 水平堆叠序列中的数组(列方向)
>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> c = np.hstack((a,b))
>>> a
array([[1, 2],
[3, 4]])
>>> b
array([[5, 6],
[7, 8]])
>>> c
array([[1, 2, 5, 6],
[3, 4, 7, 8]])
vstack 竖直堆叠序列中的数组(行方向)
numpy.vstack 是 numpy.stack 函数的变体,它通过垂直堆叠来生成数组。
>>> a = np.array([[1,2],[3,4]])
>>> print (a)
[[1 2]
[3 4]]
>>> b = np.array([[5,6],[7,8]])
>>> print (b)
[[5 6]
[7 8]]
>>> c = np.vstack((a,b))
>>> print (c)
[[1 2]
[3 4]
[5 6]
[7 8]]
5、分割数组
split 将一个数组分割为多个子数组
numpy.split(ary, indices_or_sections, axis)
-
ary
:被分割的数组 -
indices_or_sections
:果是一个整数,就用该数平均切分,如果是一个数组,为沿轴切分的位置(左开右闭) -
axis
:沿着哪个维度进行切向,默认为0,横向切分。为1时,纵向切分
>>> a = np.arange(9)
>>> print (a)
[0 1 2 3 4 5 6 7 8]
>>> b = np.split(a,3)
>>> print (b)
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]
>>> b = np.split(a,[4,7])
>>> print (b)
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8])]
>>> b[0]
array([0, 1, 2, 3])
hsplit 将一个数组水平分割为多个子数组(按列)
>>> harr = np.floor(10 * np.random.random((2, 6)))
>>> print(harr)
[[5. 4. 5. 2. 6. 8.]
[4. 0. 9. 0. 0. 6.]]
>>> print(np.hsplit(harr, 3))
[array([[5., 4.],
[4., 0.]]), array([[5., 2.],
[9., 0.]]), array([[6., 8.],
[0., 6.]])]
vsplit 将一个数组垂直分割为多个子数组(按行)
>>> a = np.arange(16).reshape(4,4)
>>> print (a)
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]
[12 13 14 15]]
>>> b = np.vsplit(a,2)
>>> print (b)
[array([[0, 1, 2, 3],
[4, 5, 6, 7]]), array([[ 8, 9, 10, 11],
[12, 13, 14, 15]])]
6、数组元素的添加与删除
resize 返回指定形状的新数组
如果新数组大小大于原始大小,则包含原始数组中的元素的副本。
>>> a = np.array([[1,2,3],[4,5,6]])
>>> print (a)
[[1 2 3]
[4 5 6]]
>>> print (a.shape)
(2, 3)
>>> b = np.resize(a, (3,2))
>>>
>>> print (b)
[[1 2]
[3 4]
[5 6]]
>>> print (b.shape)
(3, 2)
#尺寸变大,第一行重复
>>> b = np.resize(a,(3,3))
>>> print (b)
[[1 2 3]
[4 5 6]
[1 2 3]]
>>>
append 将值添加到数组末尾
numpy.append 函数在数组的末尾添加值。 追加操作会分配整个数组,并把原来的数组复制到新数组中。 此外,输入数组的维度必须匹配否则将生成ValueError。
append 函数返回的始终是一个一维数组。
numpy.append(arr, values, axis=None)
参数说明:
-
arr
:输入数组 -
values
:要向arr
添加的值,需要和arr
形状相同(除了要添加的轴) -
axis
:默认为 None。当axis无定义时,是横向加成,返回总是为一维数组!当axis有定义的时候,分别为0和1的时候。当axis有定义的时候,分别为0和1的时候(列数要相同)。当axis为1时,数组是加在右边(行数要相同)
>>> a = np.array([[1,2,3],[4,5,6]])
>>> print (a)
[[1 2 3]
[4 5 6]]
>>> print (np.append(a, [7,8,9]))
[1 2 3 4 5 6 7 8 9]
>>> print (np.append(a, [[7,8,9]],axis = 0))
[[1 2 3]
[4 5 6]
[7 8 9]]
>>> print (np.append(a, [[5,5,5],[7,8,9]],axis = 1))
[[1 2 3 5 5 5]
[4 5 6 7 8 9]]
insert 函数在给定索引之前,沿给定轴在输入数组中插入值。
如果值的类型转换为要插入,则它与输入数组不同。 插入没有原地的,函数会返回一个新数组。 此外,如果未提供轴,则输入数组会被展开。
numpy.insert(arr, obj, values, axis)
参数说明:
-
arr
:输入数组 -
obj
:在其之前插入值的索引 -
values
:要插入的值 -
axis
:沿着它插入的轴,如果未提供,则输入数组会被展开
>>> a = np.array([[1,2],[3,4],[5,6]])
>>> print (a)
[[1 2]
[3 4]
[5 6]]
#print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
>>> print (np.insert(a,3,[11,12]))
[ 1 2 3 11 12 4 5 6]
>>> print (np.insert(a,1,[11],axis = 0))
[[ 1 2]
[11 11]
[ 3 4]
[ 5 6]]
>>> print (np.insert(a,1,11,axis = 1))
[[ 1 11 2]
[ 3 11 4]
[ 5 11 6]]
delete 函数返回从输入数组中删除指定子数组的新数组。 与 insert() 函数的情况一样,如果未提供轴参数,则输入数组将展开。
Numpy.delete(arr, obj, axis)
参数说明:
-
arr
:输入数组 -
obj
:可以被切片,整数或者整数数组,表明要从输入数组删除的子数组 -
axis
:沿着它删除给定子数组的轴,如果未提供,则输入数组会被展开
>>> a = np.arange(12).reshape(3,4)
>>> print (a)
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
>>> print (np.delete(a,5))
[ 0 1 2 3 4 6 7 8 9 10 11]
>>> print (np.delete(a,1,axis = 1))
[[ 0 2 3]
[ 4 6 7]
[ 8 10 11]]
>>> a = np.array([1,2,3,4,5,6,7,8,9,10])
>>> print (np.delete(a, np.s_[::2]))
[ 2 4 6 8 10]
unique 函数用于去除数组中的重复元素。
numpy.unique(arr, return_index, return_inverse, return_counts)
-
arr
:输入数组,如果不是一维数组则会展开 -
return_index
:如果为true
,返回新列表元素在旧列表中的位置(下标),并以列表形式储 -
return_inverse
:如果为true
,返回旧列表元素在新列表中的位置(下标),并以列表形式储 -
return_counts
:如果为true
,返回去重数组中的元素在原数组中的出现次数
>>> a = np.array([5,2,6,2,7,5,6,8,2,9])
>>> print (a)
[5 2 6 2 7 5 6 8 2 9]
>>> u = np.unique(a)
>>> print (u)
[2 5 6 7 8 9]
>>> u,indices = np.unique(a, return_index = True)
>>> print (indices)
[1 0 2 4 7 9]
>>> print (a)
[5 2 6 2 7 5 6 8 2 9]
>>> u,indices = np.unique(a,return_inverse = True)
>>> print (u)
[2 5 6 7 8 9]
>>> print (indices)
[1 0 2 0 3 1 2 4 0 5]
#使用下标重构原数组
>>> print (u[indices])
[5 2 6 2 7 5 6 8 2 9]
#返回去重元素的重复数量
>>> u,indices = np.unique(a,return_counts = True)
>>> print (u)
[2 5 6 7 8 9]
>>> print (indices)
[3 2 2 1 1 1]