我试图从PyPDF2中提取文本,但它正在从PDF中提取空白文本。PDF是文本格式的,而不是基于图像的。有没有办法对pdf进行泛化,使其提取文本?因为我不想改变这个库,我的整个代码都依赖于它。在这里找到pdf:https://drive.google.com/file/d/1aoWtxNhOKwFw2xbBZgv3gzZPOvt5Ovhc/view?usp=sharing im
嗨,我试图在Adobe的文件夹中提取一组PDF文件,我让它们提取大于2页的PDF文件,并将这些摘要作为新文档保存到我的新文件夹中。我的问题是,如果我试图提取一个PDF文件,只有2页,什么也不会发生,我仍然希望将文件移动到文件夹,即使它不大于2页。var re = /\.pdf$/i;
var filename = this.documentFileName.replace(re, "&
我一直在尝试从pdfs中提取文本,我正在使用python的PyPDF2和提取文本,但现在我试图从不可复制的PDFs中提取文本。它会返回空字符串。我正在从这里在线将简单的可复制的PDF转换为不可复制的PDF:https://online-pdf-no-copy.com/ 下面是我的代码: from PyPDF2 import PdfFileReaderdef get_info(path):
with open(pat