首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >pdf2json给我一个空白的输出文本文件?

pdf2json给我一个空白的输出文本文件?
EN

Stack Overflow用户
提问于 2016-06-11 05:56:08
回答 1查看 3.3K关注 0票数 5

我在他们的github上遵循他们的"Code Example“指南。https://github.com/modesty/pdf2json#code-example

在上面写着“解析PDF然后编写.txt文件(它只包含PDF的文本内容)”的示例中,我复制并粘贴了确切的实现到我的本地JavaScript文件中,并调用它,但输出的文本文件是完全空白的。

代码语言:javascript
复制
'use strict';

let fs = require('fs');
let PDFParser = require("pdf2json");

let pdfParser = new PDFParser();

pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
    fs.writeFile("./node_modules/pdf2json/test/F1040EZ.content.txt", pdfParser.getRawTextContent());
});

pdfParser.loadPDF("./node_modules/pdf2json/test/pdf/fd/form/F1040EZ.pdf");

是不是我做错了什么?或者,这对他们来说不起作用吗?另外,Nodejs的pdf - to - text转换器有没有安装额外二进制文件的替代方案?

EN

回答 1

Stack Overflow用户

发布于 2016-08-01 20:53:50

frontpage文档有一点错误!要使此功能正常工作,只需将PDFParser参数设置为null和1

这个可以用:

代码语言:javascript
复制
var fs = require("fs");

// https://github.com/modesty/pdf2json
var PDFParser = require("./node_modules/pdf2json/PDFParser");
var pdfParser = new PDFParser(this,1);

pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError));
pdfParser.on("pdfParser_dataReady", pdfData => {
    console.log(pdfParser)
    fs.writeFile("./content.txt", pdfParser.getRawTextContent());
});

HTH -XDVarpunen

链接到pdf2json中的问题:https://github.com/modesty/pdf2json/issues/76

票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37757670

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档