目录

零、前言提要

一、参考来源和基础知识小结

二、求取容器中的最大值、最小值

2.1 python内置的max()函数

2.2 numpy模块的np.max函数(同np.amax)、np.nanmax函数

2.3 numpy模块的np.maximum()函数

2.4 numpy模块的np.fmax函数

三、求取最大值、最小值的索引(所处位置)


零、前言提要

本篇文章基于py3.8,system win10,numpy1.12。

np是numpy的缩写。

一、参考来源和基础知识小结

python内置max()、min()函数与Numpy自带的max()、min()函数性能对比分析

上面这篇文章基于python 2.7.15,system win10得出结论:python内置的max()运行速度优于numpy模块,但是使用的方便性和灵活性上numpy.max更佳。

上面这篇文章给的传播NAN和忽略NAN的概念是指“在运算过程中遇到NAN是直接把结果确立为NAN还是直接忽略NAN”。例如sum()函数默认是传播NAN的,那么sum([1,2,np.nan])的结果就是nan。而np.nansum()函数默认是忽略NAN的,因此np.nansum([1,2,np.nan])的结果是3。

二、求取容器中的最大值、最小值

下面全部以求最大值为例,最小值的效果和它是对称的。

除了求最大值是遇到Inf就捡起来,而求最大值是遇到Inf就丢掉,其他基本一样,就不赘述了。

2.1 python内置的max()函数

功能简介:求解可迭代对象的最大值或者多个参数的最大值

# 1 语法一:只有一个容器
    max(iterable, *[, key, default])

# 1.1 容器是列表、数组、元组、集合、字符串
import numpy as np
print(max([1,2,3]))  # 输出结果3
print(max(np.array([1,2,3])))  # 输出结果3
print(max((1,2,3)))  # 输出结果3
print(max({1,2,3}))  # 输出结果3
print(max('I love you, my girl.'))  # 输出为y

# 1.2 多维容器和多层嵌套
print(max([[1, 2], [3, 4]]))  # 列表形状(2,2),输出为[3, 4],说明列表是在最外一层进行比较
print(max([[[1, 2], [3, 4]]]))  # 列表形状(1,2,2),输出[[1, 2], [3, 4]],再次验证...
print(max((((1, 2, 3)),((2,3,4)))))  # 元组形状为(2,1,3),输出(2, 3, 4)
print(max(((((1, 2, 3)),((2,3,4))))))  # 元组形状为(1,2,1,3),还是输出(2, 3, 4),说明对于元组会把多余的括号去掉

#1.3 key参数用法,规定在容器的哪个位置/属性之间进行比较
print(max([{'name':'zhang','age':13},{'name':'shen','age':56}],key=lambda x:x['age']))  # 输出为{'name': 'shen', 'age': 56}

#1.4 default参数用法,规定如果得不出最大值就返回default默认值,用来避免出错
print(max((),default=1))  # 输出为1
print(max(()))  # 传入空元组,无法得出最大值,错误ValueError: max() arg is an empty sequence

#1.5 如果仅传入一个可比较参数,并且这个参数不是容器,就会报错
print(max(1))  # TypeError: 'int' object is not iterable
print(max(1.3))  # TypeError: 'float' object is not iterable

#-------------------------
# 2、语法二:传入多个参数(既可以是单个数值,也可以是容器)
    max(arg1, arg2, *args[, key])    

# 2.1 传入多个单独的数值
print(max(1,2,3,4,5,6))  # 输出为6

# 2.2 传入多个容器
print(max([1,2],[3,4],[6,-9999]))  # 输出为[6, -9999],说明仅仅比较第一个数
print(max([[1,2],[3,4]],[[0,5],[6,7]]))  # 输出为[[1, 2], [3, 4]],说明只比较第一个数

# 2.3 在多个参数之间用key
print(max({'name':'zhang','age':13},{'name':'shen','age':56},key=lambda x:x['age']))  # 输出为{'name': 'shen', 'age': 56}

#--------------------------
# 3、其他注意事项

# 3.1 千万不要加参数axis,因为内置的max函数没有这个参数

# 3.2 内置的max()函数会传播nan,而numpy.nanmax()可以避开nan
print(max([np.nan,1,2,3]))  # 输出为nan,说明内置max函数会传播nan
print(np.nanmax([np.nan,1,2,3]))  # 3.0

2.2 numpy模块的np.max函数(同np.amax)、np.nanmax函数

import numpy as np

# 1、np.max实际上就是np.amax
np.max.__name__        # 'amax'
np.max is np.amax      # True
np.amax                # <function numpy.core.fromnumeric.amax>
np.max                 # <function numpy.core.fromnumeric.amax>

# 2、语法
    np.amax(array_like, axis=None, out=None, keepdims=<no value>, initial=<no value>)

    2.1 array_like:可以是数组,也可以是和数组相似的容器(元组、列表),只能传一个这种参数
    2.2 axis:这是python内置max()没有的参数,用来指定在哪个维度上比较
    2.3 keepdims:是否保留维数
    2.4 只要包括nan,就返回nan,也即传播nan。
    2.5 只要包括Inf,就返回Inf,因为Inf是正无穷大。

# 3、实例

# 3.1 当axis=None时,对所有数进行比较得到一个最大值
print(np.max([12, 34]))  # 34
print(np.max([[12, 34], [56, 78]]))  # 结果是78而不是[56,78],说明不指定axis=None时是将所有维度下的成员进行比较,最终返回一个最大值
print(np.max([[[[[[12, 34], [56, 78]]]]]]))  # 输出78,说明不管嵌套多少层,都是返回最大的那个元素,这也是跟内置max()不一样的地方

# 3.2 当axis!=x(一个整数)时,在指定维度上比较
print(np.max([[12, 34], [10, 78]], axis=0))  # [12 78]
print(np.max([[12, 34], [10, 78]], axis=1))  # [34 78]

# 3.3 当keepdims=True时,axis指定的那个维度不会归零化
print(np.max([[12, 34], [10, 78]], axis=0, keepdims=True))  # [[12 78]]
print(np.max([[12, 34], [10, 78]], axis=1, keepdims=True))  # [[34], [78]]

 至于np.nanmax,除了会忽视nan,其他特性与np.max()、np.amax()相同。

除了利用numpy模块里的函数求最大值,也可以用ndarray数组的max属性求最大值。

import numpy as np arr = np.arange(9).reshape(3,3) print(arr.max(0)) # [6, 7, 8],参数0表示axis=0

用法和numpy.max()函数大致相同,只不过是把array参数提到max前面了。

此外要注意这种方法不能对非ndarray数组对象求最大值,因为list\tuple\set这些容器没有这个属性。

2.3 numpy模块的np.maximum()函数

# 1、语法
    np.maximum(X, Y, out=None)
   
# 2、简介
    # 2.1 X和Y逐位进行比较,选择最大值,必须接受两个进行比较的对象,多了少了都不行
    # 2.2 会传播NAN;如果存在Inf直接返回Inf

# 3、代码实现
>>> np.maximum([2, 3, 4], [1, 5, 2])
array([2, 5, 4])

>>> np.maximum(np.eye(2), [0.5, 2]) # broadcasting
array([[ 1. ,  2. ],
       [ 0.5,  2. ]])
       
>>> np.maximum([np.nan, 0, np.nan], [0, np.nan, np.nan])
array([ NaN,  NaN,  NaN])

>>> np.maximum(np.Inf, 1)
inf

2.4 numpy模块的np.fmax函数

np.fmax函数和np.maximum函数辨析:

2.4.1共同点:

        (1)都是对两个参数中的元素值进行比较,最终返回位置对应的最大值。

        (2)都可以用broadcast机制。

        (3)都必须只传入两个比较对象,多了少了都会报错

        (4)都是ufunc函数,可以配合accumulate,reduce,reduceat等属性使用。

2.4.2差异点:np.fmax会忽略NAN,而np.maximum会传播NAN。记忆技巧:f是forget,把nan给忘了,不认识它是谁,直接忽略掉了。

import numpy as np

# 1、语法
    np.fmax(x1, x2)

# 2、简介
    # 2.1 x1和x2分别是一个数值或者一个容器(数组、列表、元组),逐个元素地进行比较在每一个位置返回最大的值(浮点型),
    # 2.2 会忽略NAN,但是如果两个数都是NAN,就会返回NAN;一旦某位置有Inf,必返回Inf
    # 2.3 必须接受两个进行比较的对象,多了少了都报错

# 3、实现代码
# 3.1 传入两个数
print(np.fmax(1, 3))  # 3
print(np.fmax(1, 3, 2, 4, 5, 6))  #TypeError: fmax() takes from 2 to 3 positional arguments but 6 were given

# 3.2 容器中有nan,能避就避,避不了才用;容器中有Inf,必须用
print(np.fmax([1,np.nan],[2,999]))  # [ 2. 999.]
print(np.fmax([1,np.nan],[2,np.nan]))  # [ 2. nan]
print(np.fmax([1,np.Inf],[2,999]))  # [ 2. inf]

三、求取最大值、最小值的索引(所处位置)

 本文的第二部分都是在求一个容器中的最大值,或者两个容器之间进行逐个比较取更大值。

下面的np.argmax并不是求最大值本身,而是求最大值在哪个位置(也即索引值)。

import numpy as np

# 1、语法
    np.argmax(array_like, axis=None, out=None, *, keepdims=np._NoValue)
    
# 2、代码实现
# 2.1 说明如果有多个数值相同,返回先出现的索引值
print(np.argmax([1,2,3,4,4,4,4,4]))  # 3
print(np.argmax([[1,2],[3,2]], axis=0))  # [1 0]

# 2.1 axis=None的时候,只会返回一个索引值(python中默认的索引顺序为C,也即先行后列,先里层后外层)
print(np.argmax(np.arange(9).reshape(3,3)))  #8

# 2.2 axis=x(一个整数)时,就会在这个维度上逐个元素进行比较,比如x=0,那么就是a[0]、a[1]、...、a[len(a)-1]之间进行比较
print(np.argmax(np.arange(9).reshape(3,3), axis=0))  #[2 2 2]。当axis=0,在第0维进行比较,也即比较a[0,0]、a[1,0]和a[2,0]

# 2.3 keepdims=True时,a[0]、a[1]、...、a[len(a)-1]之间比较得到的最大值索引外的中括号不丢掉,因此维度保留
print(np.argmax(np.arange(9).reshape(3,3), axis=0, keepdims=True))  #[[2 2 2]]。