问题
在工作中,我们经常需要对列表字典集合等结构中的数据进行排序,取出最大或最小的N个值
解决方案:
这时就可以使用python中的heapq模块来快速实现我们的需求,在heapq模块中,有两个专门用来取最大和最小的N个元素的方法,分别是heapq.nlargest()和heapq.nsmallest()
语法:
nlargest
这两个方法都有三个参数:
参数 n :代表取前N个元素
参数 iterable :是你需要进行排序取值的可迭代对象
参数 key :这个参数可接受一个函数对象作为实参,当在对字典进行排序取值时这个参数非常有用,它可指定按字典中的Value进行比较排序
示例1:
假设我们要从一个列表中取出最大的5个数字,我们就可以这样写:
import
当我们要取的是最小的5个值时,我们可以这样写:
import
示例2:
假设现在我们的列表中存放的不是普通的值类型数据,而是一个个的字典时,我们可以这样写:
取出年纪最大的三个人的信息
import
注意到lambda表达式了吗,这就是第三个参数key的威力,它可以让我们指定按照字典中的哪个字段进行排序取值
取出年纪最小的三个人的信息
import
总结:
当所要找的元素数量相对较小时,使用函数heapq.nlargest()和heapq.nsmallest()是非常合适的,但如果只是想简单的找出最小和最大的数字(N=1)时,那么使用min()和max()会更快一些,同样如果N和集合本身的大小差不多大,通常更快的方法是先对集合排序,然后做切片操作,例如:sorted(items)[:N]或者sorted(items)[-N:],应该要注意的是,nlargest()和nsmallest()的实际实现会根据使用它们的方式而有所不同,可能会相应做出一些优化措施,比如,当N的大小同输入大小很接近时,就会采用排序的方法。