腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
使用FOP从A
4
PDF
中
提取
页面并创建A3
PDF
目前,我使用FOP和XSLT创建A
4
文档。我被要求把这些A
4
(肖像画)页缝成A3小册子。例如,我有一个
4
页的A
4
文档,我需要把它转换成一个2边的A3小册子,它可以使用第
4
页和第1页(并排)命令第一边,然后是第2页和第3页。 我查看了PDFBOX,看看它是否能做到这一点,但没有取得成功。
浏览 4
提问于2016-08-16
得票数 0
回答已采纳
6
回答
如何使用
pdf
.js从
pdf
中正确
提取
文本
我尝试使用
pdf
.js将
pdf
文件中所有页面的文本
提取
到字符串数组中。当
提取
完成后,我想以某种方式解析数组。假设
pdf
文件(通过typedarray正确传递)有
4
页面,我的代码是: let str = [];
pdf
.getPage(i).t
浏览 493
修改于2019-10-21
得票数 16
回答已采纳
1
回答
如何将
PDF
文件名中的日期
提取
为数据集?
我正在尝试从多个
PDF
中
提取
日期,以便在dataset中创建日期列。下面是我刚刚拥有的包含文件名的数据集。# A tibble: 260 x 1 <chr> 1 ./2012.01.18.
pdf
2 ./2012.02.07.
pdf
3 ./2012.03.12.
pdf</em
浏览 6
提问于2022-11-27
得票数 1
回答已采纳
3
回答
使用正则表达式从给定的链接列表中
提取
pdf
链接
但我只需要
提取
PDF
链接。/abcdef/higjkl/Thisisthe-required-document-link-
4
ea
4
-8f1c-dd36a1f55d6f.
pdf
" target="_blank"><img alt=/Include/images/
pdf
.png"/></a>'] 因此,我只需要
提取
从
浏览 1
修改于2018-06-20
得票数 1
回答已采纳
1
回答
如何在将文档从
PDF
转换为文本时处理unicode字符编码问题
我正在尝试从
PDF
中
提取
文本。
PDF
包含印地语(Unicode)文本。我使用的
提取
实用程序是Apache PDFBox ( )。
提取
器
提取
文本,但文本无法识别。下面是一个例子:假设
PDF
中的文本是:पवार有什么建议吗?
浏览 3
提问于2011-09-20
得票数 4
回答已采纳
3
回答
字符串行在位置n=
4
上匹配,需要从位置n+2
提取
值
我正在从
PDF
中
提取
数据:5 XZXZXZXZXZXZXwith pdfplumber.open(file) as
pdf
: text = page.extract_text()
浏览 21
修改于2021-02-23
得票数 0
回答已采纳
4
回答
如何使用Python从
PDF
中
提取
表作为文本?
我有一个
PDF
,其中包含表格,文字和一些图像。我想从
PDF
文件中的任何位置
提取
表格。 PDFfilename = "Sammamish.
pdf
" #filename of your
PDF
/directory where your
PDF
is storedpfr = PyPDF2.PdfFileReader(open(PDFfilena
浏览 4
修改于2020-09-30
得票数 47
回答已采纳
1
回答
提取
PDF
的部分
我正在尝试
提取
PDF
文件的部分,以便在文本分析中使用。我尝试使用来实现这一点。但是,像这样的命令仅
提取
区域的(x,y)坐标,如下例所示。<region x="226.32" y="750.47" width="165.57" height="6.37" line_height="6.37"
浏览 0
提问于2016-07-29
得票数 0
1
回答
如何使用VBA通过透视切片器进行筛选?
我有一个最终
提取
PDF
的宏。我需要
提取
当月的
PDF
它是+3个月过滤。 我该怎么做呢?因此,例如,如果用户在三月选择了切片器,宏将只
提取
三月的
PDF
,但我需要它同时
提取
同一
PDF
文件中的四月、五月和六月(因此文件中有
4
页)。我希望这是有意义的。
浏览 0
修改于2019-02-19
得票数 0
1
回答
将多个
pdf
文件中的特定页面写入一个新
pdf
文件
我有多个
pdf
文件,我想
提取
一组特定的页面,其中每组页面是不同的每一个
pdf
文件。我已经创建了一个字典,其中键作为
pdf
文件名,值作为从每个
pdf
文件中
提取
的页面列表(显示为键)。我打算从相关的
pdf
文件中
提取
给定的页面,并将它们全部写入一个新的
pdf
文件中,以便我可以在这个最终文件上进行数据
提取
。我尝试过PyPDF
4
和FPDF,但到目前为止还没有joy给我一个很大的
pdf
和空白页
浏览 7
修改于2022-02-10
得票数 0
回答已采纳
21
回答
如何从
PDF
文件中
提取
文本?
我正在尝试使用Python
提取
包含在文件中的文本。我使用的是模块,并具有以下脚本:
pdf
_file = open('sample.
pdf
')number_of_pages = read_
pdf
.getNumPages()page_content = page.extractText
浏览 326
修改于2018-10-06
得票数 266
1
回答
在下面的文件夹/目录中找到一个具有zip的文件名,并将其解压缩到同一个目录中的一个新文件夹中?
现在,我想从DataFrame中的文件列表中
提取
压缩文件夹。DataFrame file_1.
pdf
file_1
pdf
C:\\temp\documents\file_1.
pdf
\file_1.
pdf
file_2.zip file_2 zip C:\\temp\tar file_
4
浏览 3
修改于2019-11-12
得票数 0
1
回答
将带格式的文本从
pdf
提取
为html
我需要将
PDF
文档转换为HTML。我可以在下面实现的地方。2-
提取
图像5-将配色方案应用于HTML页面。 任何帮助都将不胜感激。
浏览 0
修改于2013-02-26
得票数 0
2
回答
提取
PDF
的部分
我试图
提取
一部分
pdf
(该部分的坐标将始终保持不变)使用
PDF
夏普。然后,我将调整该部分的大小为
4
“x6”,以打印在一个粘性的背标签上。我如何
提取
PDF
的部分?这是在控制台应用程序C#中完成的。
浏览 1
提问于2017-05-11
得票数 1
回答已采纳
3
回答
如何使用ABCPdf.NET从
PDF
文件的所有页面
提取
文本?
如何使用ABCPdf.NET工具从
PDF
文件中
提取
内容文本?我尝试了GetText方法,但没有
提取
内容: Response.Write(xmlContents); d
浏览 0
修改于2012-06-12
得票数 4
回答已采纳
1
回答
文档理解是从UiPath中所有
pdf
页面中
提取
数据。
我正在使用文档理解UiPath从多个
pdf
文件中
提取
数据。每个
pdf
文件包含同一页的多份副本,我无法删除。的问题是:2.) --它也是
提取
它下面的其他无关数据--以及所需的数据。 I无法从
pdf
文件中删除重复的页面。因此,我不能使用ML抽取器,因为它的限制为2页和
4
mb大小的。目前,我正在使用表单抽取器和Regex 来
提取
数据,它们都是从中<em
浏览 7
修改于2022-03-11
得票数 1
2
回答
Apache PDFBox删除字符之间的空格。
我们使用PDFBox从
PDF
中
提取
文本。 在文本
提取
之后,我们得到以下文本:(空格加在',‘和’8‘之间) PDFTextStripper pdfStr
浏览 2
修改于2015-04-10
得票数 6
回答已采纳
1
回答
如何使用PyPDF2
提取
文本几何?
我有
pdf
文档。我很清楚如何从中
提取
文本。from PyPDF2 import PdfReader
pdf
= PdfReader(
pdf
_path)page_1_object.extractText().split(&qu
浏览 6
提问于2022-08-26
得票数 0
回答已采纳
1
回答
SOLR 7.1 Extracthandler Extracthandler extract
PDF
会添加很多我不想要的额外元数据,这在solr 6中是不会发生的
1.SOLR 7
提取
pdf
将添加许多模式列(
pdf
meta)和额外的meta
pdf
数据
4
.如何关闭它
浏览 0
提问于2017-10-24
得票数 0
1
回答
两种HTML的比较
我在2
pdf
比较工作,在那里我
提取
的第一个
pdf
,以获得的
PDF
格式的样式,.
PDF
样式被
提取
和转换为html。最后,我比较了两个HTML文本。 this.result.AppendFormat( "<tr><td>{0}</td><td>{1}</td><td>{2}pt<&
浏览 1
修改于2013-06-04
得票数 2
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券