在使用argmax()函数时,比如在深度学习里面计算acc经常要用到这个参数,这个参数返回的是沿轴axis最大值的索引值,对于,tensorflow和numpy用法是一样的,此处我就用numpy来举例说明。

argmax(a, axis=None, out=None)
# a 表示array
# axis 表示指定的轴,默认是None,表示把array平铺,
# out 默认为None,如果指定,那么返回的结果会插入其中
  • 1
  • 2
  • 3
  • 4

对于axis默认为None的情况

首先我们看axis=None,也就是默认的时候:

二维array情况

a = np.array([[2,5,6],[7,6,1]])
print(np.argmax(a))
  • 1
  • 2

输出结果为3,因为a里面7是最大的,如果没有指定axis,默认就是None,相当于把array平铺为:[2,5,6,7,6,1],那么结果就是3,因为索引3对应的值最大,再来看一下三维的情况 
### 三维array的情况

b = np.random.randint(20,size=[3,2,2])
print(b)
[[[ 0 16]
  [14  5]]

 [[16  6]
  [19  2]]

 [[11 11]
  [ 5  7]]]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

这个里面,19最大,把它平铺,19对应的索引就是6,那么np.argmax(b)就是6,经过验证输出就是6

对于给定axis的情况

如果给定axis,那么返回的就是沿着给定轴的最大索引,所谓沿着,我觉得就是投影,就是沿着这个轴投影,每一根投影线上最大值的索引。

二维情况分析

a = np.array([[2,5,6],[7,6,1]])
print(np.argmax(a,axis=1))
[2 0]
  • 1
  • 2
  • 3

这次,我们给定axis=1,那么按照我们说的,就是沿着axis=1投影,看得出来,投影后我们只有两个值,因为[2,5,6]在一根投影线上,相当于就是我理解的一个投影线,因为这些值投影后重叠了,相当于只有一个值,所以[7,6,1]也是一个投影线,然后在这两个投影线取最大值的索引,对于[2,5,6]来说,最大值索引就是2,[7,6,1]最大值索引就是0,所以结果为[2,0] 
然后,我们分析,当我们设置axis=0的时候,也就是沿着axis=0,投影,那么[2,7],[5,6],[6,1]分别在一个投影线上,所以结果为[1,1,0],经过验证确实是这样的。

三维情况分析

b = np.random.randint(20,size=[3,2,2])
print(b)
[[[ 0 16]
  [14  5]]

 [[16  6]
  [19  2]]

 [[11 11]
  [ 5  7]]]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

还是用上面的array来说,看一下结果:

print(np.argmax(b,axis=1))
[[1 0]
 [1 0]
 [0 0]]
  • 1
  • 2
  • 3
  • 4

同样的分析,我们指定了轴为1,那么也就是说我们沿着axis=1轴投影,这是一个体,那么我们投影线相当于有3*2条,其实在同一根投影线上是axis=0和axis=2的一个组合,比如axis=1中第一个上的和axis=2的第一个上的组合,也就是b[0,:,0],b[0,:,1],b[2,:,0],b[2,:,1],b[3,:,0],b[3,:,1]这六条线的索引对应的最大值,我们看他们分别为[ 0 14],[16 5],[16 19],[6 2],[11 5],[11 7],那么结果就是[[1,0],[1,0],[0,0]]。 
所以其实和二维是一样的,所谓投影线,其实可以这样表示,我们去axis=0,那么我们遍历其他维度的大小,比如 arr[:,0,0],arr[:,0,1],也就是沿着那个轴,那么轴取全部值,然后再在投影线上找最大值对应索引。

总结

tensorflow里面的是一样的用法,同时argmin()用法相同,只是他是求最小值的索引。