文章/答案/技术大牛

发布

社区首页 >问答首页 >pdf2json npm包没有提取段落中的数据，有没有其他的npm？

问pdf2json npm包没有提取段落中的数据，有没有其他的npm？
EN

Stack Overflow用户

提问于 2022-09-19 07:21:59

回答 2查看 38关注 0票数 0

我尝试用pdf2json npm软件包从pdf中提取数据，但它没有提取段落中的数据。

我有一个pdf文件，其中包含表格，副词和图表在它，我想提取原始数据作为一个文本文件。

是否有其他选项可以使用节点js从段落中的pdf中提取数据。

javascript

node.js

npm

回答 2

Stack Overflow用户

发布于 2022-11-04 10:06:31

您可以使用pdf-parse npm包获取原始文本内容。这是链接https://www.npmjs.com/package/pdf-parse

票数 0

Stack Overflow用户

发布于 2022-11-07 16:54:37

“pdf -解析”将做那些与pdf相异的概念段落，然而，这套方案似乎早已被抛弃。

有关仍在维护的分叉，请参见https://www.npmjs.com/package/pdfdataextract

“pdfdata提取物”将输出行合并，实际上抱怨的是，它不保留在有效的原始PDF提取中的自然单行。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/73769758

复制

相似问题

问pdf2json npm包没有提取段落中的数据，有没有其他的npm？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问pdf2json npm包没有提取段落中的数据，有没有其他的npm？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问pdf2json npm包没有提取段落中的数据，有没有其他的npm？
EN