腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
4
回答
从
pdf
flle中
提取
页面
我想以另一个
PDF
文件的形式从
PDF
文件中
提取
第
10
页。程序qpdf应该能做到这一点。当我运行命令时它似乎完成了
提取
,但是没有输出;没有创建文件mtg.
pdf
。我得到了同样的结果(更直接的命令) qpdf 0092434747.
pdf
--pages .
10
-- mtg.
pdf</em
浏览 0
修改于2023-03-21
得票数 1
1
回答
如何将
PDF
文件名中的日期
提取
为数据集?
我正在尝试从多个
PDF
中
提取
日期,以便在dataset中创建日期列。下面是我刚刚拥有的包含文件名的数据集。# A tibble: 260 x 1 <chr> 1 ./2012.01.18.
pdf
2 ./2012.02.07.
pdf
3 ./2012.03.12.
pdf</em
浏览 6
提问于2022-11-27
得票数 1
回答已采纳
3
回答
使用Python从
PDF
所有页面和输出文件中
提取
文本
我使用这段代码来
提取
文本。是否可以
提取
所有页面并将其输出到文件中?import PyPDF2read_
pdf
= PyPDF2.PdfFileReader(
pdf
_file)page = read_
pdf
.getPage(
10
) page_co
浏览 2
提问于2017-04-10
得票数 6
1
回答
如何使用IBM Watson Explorer
提取
PDF
URL的关键字属性?
我想从
PDF
链接中
提取
PDF
的关键字值。我正在爬行一个页面,其中包含一些
PDF
的链接。我想建立一个虚拟文档,在那里我必须将这些
PDF
入队。我不想抓取这些
PDF
的内容,但我只想从这些
PDF
中
提取
关键字。当我使用inspect source打开这些
PDF
链接时,它确实有一个关键字字段。但是它没有任何关键字的值。它看起来是这样的: <span data-l
浏览 17
修改于2018-07-05
得票数 2
7
回答
中间的C#子串
我有以下数据:D:\toto\food\Cloture_856589_12_01_2013.
pdf
如何
提取
日期部分?例如:
浏览 0
修改于2015-08-11
得票数 4
回答已采纳
1
回答
用python从
pdf
中
提取
特定文本
是否可以使用python从
pdf
中
提取
特定的文本。 测试用例:我有一个超过
10
页的
PDF
文件,我需要
提取
特定的文本和与它们相关联的值。示例:用户:value用户id:value。需要
提取
这些值。
浏览 3
提问于2020-05-10
得票数 0
2
回答
如何在Java中从
pdf
中获取指定的页面范围?
我有一个很大(大约1000页)的
pdf
文件。是否需要从
pdf
(作为新
pdf
文件)中
提取
某些Java API/库(例如6-
10
页)?
浏览 0
提问于2012-04-12
得票数 0
回答已采纳
2
回答
简化Python中的嵌套Try Catch
我有一个不同类型的
PDF
文件列表。不同的类型包含的信息不同,格式也不同。基于
PDF
的类型,我需要从它们中
提取
不同的信息。为此,我使用了两个Python库,它们允许我以不同的方式从
PDF
文件中
提取
数据。问题是,例如,我可以通过查看数据帧中的索引
10
来识别
PDF
_1,而在读取
PDF
_2时,没有索引
10
,所以我得到了一个IndexError。
浏览 1
修改于2020-07-07
得票数 0
1
回答
如何使用PyPDF2
提取
文本几何?
我有
pdf
文档。我很清楚如何从中
提取
文本。from PyPDF2 import PdfReader
pdf
= PdfReader(
pdf
_path)page_1_object.extractText().split(&qu
浏览 6
提问于2022-08-26
得票数 0
回答已采纳
4
回答
是否有Linux CLI工具可用于
提取
页面范围以生成较小的
PDF
?
有没有一个cli工具可以
提取
pdf
的部分并制作新的更小的
pdf
?我想这样做: pdftool -s 4 -e
10
'thefile.
pdf
‘"thenew.
pdf
',其中-s和-e分别是起始页和结束页。
浏览 0
修改于2012-08-07
得票数 2
回答已采纳
1
回答
从
PDF
中
提取
MP3音频或声音
MP3音频不是附件,它们不显示在Acrobat的附件面板上,它们显示在评论面板上,Adobe /Acrobat只能将它们导出到Acrobat的数据文件中,这是一个类似于
pdf
的数据文件。不幸的是,
PDF
文件不能作为档案打开,从中
提取
文件。洗发水
PDF</
浏览 0
修改于2020-10-09
得票数 1
回答已采纳
2
回答
从2个字符串或变量创建Dataframe名称
我正在从
pdf
文件中
提取
选定的页面。并希望根据
提取
的页面分配数据帧名称: file = "abc"for i in selected_pages(): df{str(i)} = read_
pdf
(path + file + ".
p
浏览 27
提问于2019-10-13
得票数 0
2
回答
如何从这个压缩的
PDF
/A中
提取
文本?
为了机器学习目的(),我需要从很多
PDF
文件中
提取
原始文本。+"\""+
pdf
+".txt"+"\""with open(
pdf
+".txt") as f: print("") pass
浏览 12
修改于2020-05-21
得票数 4
回答已采纳
1
回答
如何将
pdf
文件的内容
提取
为字符串变量
我想知道如何( perl脚本)
提取
pdf
的内容并将其插入数据库。示例:我有一个
pdf
文件(参见下面的示例: MyPdfFile),我希望从这个文件中
提取
项目代码项目(A和B)、数量(3和2)和价格(
10
和20),并将它们插入数据库(表:订单)。
浏览 0
提问于2019-01-28
得票数 1
回答已采纳
2
回答
使用Imagemagick将一系列页面从
pdf
提取
到jpeg时输出文件名
我正在尝试使用convert (Imagemagick)从多页
pdf
文件中
提取
一系列页面到单独的jpeg中。
提取
工作正常。我坚持的是,如果我想
提取
页面范围
10
-20,我仍然得到名称为page-0.jpeg到page-9.jpeg的jpeg文件,而我希望它们被命名为page-
10
.jpeg到page-20.jpeg。我之所以需要这样做,是因为我想以
10
为单位
提取
页面,以避免消耗太多内存来存储巨大的
pdf
文件,并且不想不断地重命名这些文件
浏览 0
提问于2009-12-30
得票数 4
回答已采纳
1
回答
不同相对url中的刮取液url
我试图
提取
的
pdf
以及
10
k表单(以html格式)使用Scrapy。为了
提取
它们,我使用以下css选择器:most_recent = response.css("div.view_btn > a::attr(href)").getall(),它按预期返回['/Click但是
pdf
和html的url在每个相对的url中。刮伤怎么能得到绝对和“正确”的url?(“更正”url = ) 我需要url,因为scrapy将响应发送到另一个函数,以便下载
pdf</
浏览 1
提问于2021-08-28
得票数 1
回答已采纳
1
回答
扫描时CGPDFScanner - \x15字符
我试图在中
提取
第5页的文本。当遇到这个字符时,当前字体是上面提到的字体,它没有从
pdf
字符串中
提取
文本。
浏览 5
提问于2015-07-07
得票数 0
回答已采纳
1
回答
提取
列treeview中的某些值
基本上,我试图在这个块中创建一个按钮,该按钮将创建一个
pdf
的我的treeview。我所要做的就是对我的treeview中的每一行都有数据,只从其中一列“行”中
提取
数据,然后放入
pdf
中。是因为行
pdf
.cell(200,
10
, txt=word, ln=1, align='L')有txt,它不能处理字符串变量word吗?我们很感激你的帮助!()
浏览 1
提问于2021-12-15
得票数 1
回答已采纳
3
回答
从
PDF
中
提取
原始嵌入式图像的软件工具?
有谁知道一个简单的(可能是免费的) Windows
PDF
提取
器吗?有人能推荐好的软件吗?
浏览 0
修改于2015-11-29
得票数 3
2
回答
从我试图
提取
的
PDF
文档中省略页面
我试图用tabula-py从多页
PDF
中
提取
表格,虽然
PDF
的某些页面上的表被完美地
提取
出来,但是-一些页面被完全省略了。遗漏似乎是随机的,并且不遵循
PDF
上任何可见的视觉特性(因为每一页看起来相同),因此表格省略了第1页、
提取
的第2页、省略的第3和第4页、
提取
的第5页、省略的第6页、
提取
的第8和9页、省略的
10
、
提取
的11我尝试过将
PDF
分成更短的部分,甚至是一个寻呼机,但是不管我尝试了什么,省略
浏览 3
提问于2018-07-29
得票数 3
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券