我在他们的github上遵循他们的"Code Example“指南。https://github.com/modesty/pdf2json#code-example
在上面写着“解析PDF然后编写.txt文件(它只包含PDF的文本内容)”的示例中,我复制并粘贴了确切的实现到我的本地JavaScript文件中,并调用它,但输出的文本文件是完全空白的。
'use strict';
let fs = require('fs');
let PDFParser = require("pdf2json");
let pdfParser = new PDFParser();
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
fs.writeFile("./node_modules/pdf2json/test/F1040EZ.content.txt", pdfParser.getRawTextContent());
});
pdfParser.loadPDF("./node_modules/pdf2json/test/pdf/fd/form/F1040EZ.pdf");是不是我做错了什么?或者,这对他们来说不起作用吗?另外,Nodejs的pdf - to - text转换器有没有安装额外二进制文件的替代方案?
发布于 2016-08-01 20:53:50
frontpage文档有一点错误!要使此功能正常工作,只需将PDFParser参数设置为null和1
这个可以用:
var fs = require("fs");
// https://github.com/modesty/pdf2json
var PDFParser = require("./node_modules/pdf2json/PDFParser");
var pdfParser = new PDFParser(this,1);
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError));
pdfParser.on("pdfParser_dataReady", pdfData => {
console.log(pdfParser)
fs.writeFile("./content.txt", pdfParser.getRawTextContent());
});HTH -XDVarpunen
链接到pdf2json中的问题:https://github.com/modesty/pdf2json/issues/76
https://stackoverflow.com/questions/37757670
复制相似问题