Python 标准库有超过 200 个模块,程序员可以在他们的程序中导入和使用。虽然普通程序员对其中许多模块都有一些经验,但很可能有一些好用的模块他们仍然没有注意到。
我发现其中许多模块都包含了在各个领域都非常有用的函数。比较数据集、协作其他函数以及音频处理等都可以仅使用 Python 就可以自动完成。
因此,我编制了一份您可能不知道的 Python 模块的候选清单,并对这几个模块进行了适当的解释,以便您在将来理解和使用它们。
所有这些模块都有不同的函数和类,本文包含了几个鲜为人知的函数和类,因此即使您听说过这些模块,也可能不知道它们的某些方面和用途。
1. difflib
difflib
是一个专注于比较数据集(尤其是字符串)的 Python 模块。为了具体了解您可以使用此模块完成的几件事,让我们检查一下它的一些最常见的函数。
SequenceMatcher
SequenceMatcher
是一个比较两个字符串并根据它们的相似性返回数据的函数。通过使用 ratio()
,我们将能够根据比率/百分比来量化这种相似性。
语法:
下面这个简单的例子展示了该函数的作用:
get_close_matches
接下来是 get_close_matches
,该函数返回与作为参数传入的字符串最接近的匹配项。
语法:
下面解释一下这些可能有些混乱的参数:
-
word
是函数将要查看的目标单词。 -
possibilities
是一个数组,其中包含函数将要查找的匹配项并找到最接近的匹配项。 -
result_limit
是返回结果数量的限制(可选)。 -
min_similarity
是两个单词需要具有的最小相似度才能被函数视为返回值(可选)。
下面是它的一个使用示例:
除此之外还有几个是可以查看的属于 Difflib
的其他一些方法和类:unified_diff
、Differ
和 diff_bytes
。
2. sched
sched
是一个有用的模块,它以跨平台工作的事件调度为中心,与 Windows 上的任务调度程序等工具形成鲜明对比。大多数情况下,使用此模块时,都会使用 schedular
类。
更常见的 time
模块通常与 sched
一起使用,因为它们都处理时间和调度的概念。
创建一个 schedular
实例:
可以从这个实例中调用各种方法。
- 调用
run()
时,调度程序中的事件/条目会按照顺序被调用。在安排完事件后,此函数通常出现在程序的最后。 -
enterabs()
是一个函数,它本质上将事件添加到调度程序的内部队列中。它按以下顺序接收几个参数:
- 事件执行的时间
- 活动优先级
- 事件本身(一个函数)
- 事件函数的参数
- 事件的关键字参数字典
下面是一个示例,说明如何一起使用这两个函数:
还有几个扩展 sched
模块用途的函数:cancel()
、enter()
和 empty()
。
3. binaascii
binaascii
是一个用于在二进制和 ASCII
之间转换的模块。
b2a_base64
是 binaascii
模块中的一种方法,它将 base64
数据转换为二进制数据。
下面是这个方法的一个例子:
该段代码应该是不言自明的,简单地说,它涉及编码、转换为 base64
,以及使用 b2a_base64
方法将其转换回二进制。
以下是属于 binaascii
模块的其他一些函数:a2b_qp()
、b2a_qp()
和 a2b_uu()
。
4. tty
tty
是一个包含多个实用函数的模块,可用于处理 tty
设备。
以下是它的两个函数:
-
setraw()
将其参数 (fd) 中文件描述符的模式更改为 raw。 -
setcbreak()
将其参数 (fd) 中的文件描述符的模式更改为 cbreak。
由于需要使用 termios
模块,该模块仅适用于 Unix
,例如在上述两个函数中指定第二个参数(when=termios.TCSAFLUSH
)。
5. weakref
weakref
是一个用于在 Python 中创建对对象的弱引用的模块。
弱引用是不保护给定对象不被垃圾回收机制收集的引用。
以下是与该模块相关的两个函数:
-
getweakrefcount()
接受一个对象作为参数,并返回引用该对象的弱引用的数量。 -
getweakrefs()
接受一个对象并返回一个数组,其中包含引用该对象的所有弱引用。
weakref
及其函数的使用示例:
输出从输出的函数返回值我们可以看到它的作用。由于 num
没有弱引用,因此 getweakrefs()
返回的数组为空。
以下是与 weakref
模块相关的一些其他函数:ref()
、proxy()
和 _remove_dead_weakref()
。
总结
-
Difflib
是一个用于比较数据集,尤其是字符串的模块。例如,SequenceMatcher
可以比较两个字符串并根据它们的相似性返回数据。 -
sched
是与 time
模块一起使用的有用工具,用于使用 schedular
实例安排事件(以函数的形式)。例如,enterabs()
将一个事件添加到调度程序的内部队列中,该队列将在调用 run()
函数时运行。 -
binaascii
可在二进制和 ASCII
之间转换以编码和解码数据。b2a_base64
是 binaascii
模块中的一种方法,它将 base64
数据转换为二进制数据。 -
tty
模块需要配合使用 termios
模块,并处理 tty
设备。它仅适用于 Unix
。 -
weakref
用于弱引用。它的函数可以返回对象的弱引用,查找对象的弱引用数量等。其中非常使用的函数之一是 getweakrefs()
,它接受一个对象并返回一个该对象包含的所有弱引用的数组。
这些函数中的每一个都有其各自的用途,每一个都有不同程度的有用性。了解尽可能多的 Python 函数和模块非常重要,以便保持稳定的工具库,使得我们可以在编写代码时快速使用。