python pdfminer PDFTextExtractionNotAllowed 找不到
原创
©著作权归作者所有:来自51CTO博客作者wx63637f8e01d6a的原创作品,请联系作者获取转载授权,否则将追究法律责任

项目中之前一直都是如下导包,未曾改动过,在此之前都是好好的能够运行,直到今早…
很早的来到公司(六点四十的闹钟没关,七点到了公司),开心的打开 Pycharm ,点击运行~~~~竟然报错了
在运行之前我下载了 tabula-py
依赖,想要实现 PDF 提取表格的需求,开始怀疑是不是这个库导致的冲突

一番卸载(tabula-py
)、重启(PyCharm
程序员:重启能够解决 99% 问题的直觉,肯定不是我的问题,一定是环境问题,之前还好好的,怎么突然就不行了呢)、更新(pip install --upgrade pdfminer
),运行报错仍然存在,看来跟新下载的tabula-py
没有什么关系,怎么会呢?那么又是哪里出现问题了呢???开始陷入深思~~~
竟然不可以运行,为什么呢?
看看日志吧!!!
错误日志
1、详细日志
PDFTextExtractionNotAllowed
Traceback (most recent call last):
File "F:\2022\mine\FileConversion\main.py", line 5, in <module>
from manager.PDFManager import PDFManager
File "F:\2022\mine\FileConversion\manager\PDFManager.py", line 12, in <module>
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
ImportError: cannot import name 'PDFTextExtractionNotAllowed' from 'pdfminer.pdfinterp' (C:\Users\【用户名】\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\pdfminer\pdfinterp.py)

PDFDocument
Traceback (most recent call last):
File "F:\2022\mine\FileConversion\main.py", line 5, in <module>
from manager.PDFManager import PDFManager
File "F:\2022\mine\FileConversion\manager\PDFManager.py", line 13, in <module>
from pdfminer.pdfparser import PDFParser, PDFDocument
ImportError: cannot import name 'PDFDocument' from 'pdfminer.pdfparser' (C:\Users\【用户名】\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\pdfminer\pdfparser.py)

2、关键日志
导包怎么出错了,导包的代码都没改过,之前都是能运行的 :)
ImportError: cannot import name ‘PDFTextExtractionNotAllowed’ from ‘pdfminer.pdfinterp’
错误导包
PDFTextExtractionNotAllowed
来自 pdfinterp
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams, LTImage, LTFigure
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
from pdfminer.pdfparser import PDFParser, PDFDocument
正确导包
PDFTextExtractionNotAllowed
来自 pdfpage
同理
PDFDocument
也来自 pdfpage
导入成功,没有了Cannot find declaration to go to
错误提示
运行成功
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFTextExtractionNotAllowed
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams, LTImage, LTFigure
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
对 PDFTextExtractionNotAllowed 导入来源做了修改。
竟然可以运行,为什么呢?