任务描述:

检查Word文件中包含特定关键字的所有页码。

基本思路:

Word文件属于流式文件,在没有打开之前难以确定页码,可以考虑临时转换为PDF文件,这样就可以确定页码了,再逐页提取PDF文件中的文字,如果包含特定关键字就输出相应的页码。

参考代码:


python中使用win32com进行多world合并时不需要保留页眉_Python批量处理表格有用吗