我有个问题。我需要从pdf中提取的一些图像不是作为图像转换为pdf,而是作为Stamp。我得到了很多PDF,我想从这些PDF中提取所有的邮票和所有的图像(我有一个脚本用于所有图像,但不是所有的邮票)。我只想要这些邮票的JPG,但我不知道如何才能解析这些PDF和提取所有的JPG格式的邮票。我想在python 3中做到这一点。
非常感谢!致以敬意,
发布于 2021-08-18 10:58:02
使用use或pyMuPDF,您可以执行以下操作:
#!/usr/bin/python
import fitz
pdf_document = fitz.open("file.pdf")
for current_page in range(len(pdf_document)):
for annot in pdf_document[current_page].annots():
xref = annot.get_pixmap()
xref.writePNG("page%s-%s.png" % (current_page, xref))https://stackoverflow.com/questions/67622246
复制相似问题