文章目录

  • 更改维度
  • 调整坐标轴
  • 牛刀小试
  • Numpy函数


调整形状

调整形状

reshape, resize, flatten, ravel, squeeze

调整坐标轴

transpose, swapaxes

更改维度

数组中的数据在内存里是固定的,但计算时的排列方式却可以随时更改,这也是数组的强大之处。其中,reshaperesize功能相同,区别是前者返回新数组,后者则直接修改原始数组。

>>> x = np.arange(12)
>>> y = x.reshape(2,6)
>>> print(x)
[ 0  1  2  3  4  5  6  7  8  9 10 11]
>>> print(y)
[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]
>>> x.resize(2,6)
>>> print(x)
[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]

-1表示自动规划某一轴的尺寸,例如

>>> x.reshape(3,-1)
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

flattenravel相当于reshape(-1),即将数组展平为一维数组。

squeeze则比flatten稍微温和一点,会删除尺寸为1的维度,例如

>>> x.resize(1,3,4,1,1)
>>> print(x)
[[[[[ 0]]

   [[ 1]]

   [[ 2]]

   [[ 3]]]


  [[[ 4]]

   [[ 5]]

   [[ 6]]

   [[ 7]]]


  [[[ 8]]

   [[ 9]]

   [[10]]

   [[11]]]]]

上面的这个x有太多层括号,看上去毫无卵用,这个时候可以用squeeze

>>> x.squeeze()
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

有木有瞬间清爽了许多。

调整坐标轴

transposeswapaxes用于调整坐标轴,如果用矩阵的视角去理解,那么大致相当于转置。

>>> x
array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11]])
>>> x.T
array([[ 0,  6],
       [ 1,  7],
       [ 2,  8],
       [ 3,  9],
       [ 4, 10],
       [ 5, 11]])
>>> x.transpose(1,0)
array([[ 0,  6],
       [ 1,  7],
       [ 2,  8],
       [ 3,  9],
       [ 4, 10],
       [ 5, 11]])

其中,transpose(1,0)表示将第一个坐标轴和第0个坐标轴交换位置。

牛刀小试

熟练掌握数组形状的变换方法,也就相当于熟悉了张量的运算法则,这对于数据科学来说是非常重要的基础技能。

例如,现有300张图像200x100的图像,想要得到每张图像的列质心。传统思路肯定是跑循环,但众所周知Python的循环效率比较慢,所以最佳方法是300张一起做,无非就是300x200x100的张量,对第二个坐标轴进行质心提取而已

imgs = np.random.rand(300,200,100)
xs = np.arange(100)
xCen = np.matmul(imgs, xs) / np.sum(imgs, axis=2)

其中,xCen就是所要求的质心。

当然,也可以用更加直观的做法

xCen = imgs.reshape(-1,100)@xs / np.sum(imgs.reshape(-1,100), axis=1)
xCen = xCen.reshape(300,200)

Numpy函数

对于上面这几种数组的内置方法,有一些可直接从numpy中调用,这样的好处是可以直接对非数组格式的数据进行操作,例如

>>> x = list(range(12))
>>> np.reshape(x, (3,4))
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

其中,x是一个列表,np.reshape会自动将其转化为数组后再行操作。

同样地,flatten也可以完成数组展平的任务

>>> x = [[i, i+1] for i in range(5)]
>>> x
[[0, 1], [1, 2], [2, 3], [3, 4], [4, 5]]
>>> np.ravel(x)
array([0, 1, 1, 2, 2, 3, 3, 4, 4, 5])