首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用JavaScript从PDF中提取图像

用JavaScript从PDF中提取图像
EN

Stack Overflow用户
提问于 2013-09-08 11:59:53
回答 2查看 19.9K关注 0票数 10

我想写的JavaScript代码,以提取所有的图像文件从一个PDF文件,可能会得到他们的JPG或一些其他图像格式。已经有一些用于读取PDF文件的JavaScript代码,例如在PDF查看器pdf-js中。

代码语言:javascript
复制
window.addEventListener('change', function webViewerChange(evt) {
  var files = evt.target.files;
  if (!files || files.length === 0)
    return;

  // Read the local file into a Uint8Array.
  var fileReader = new FileReader();
  fileReader.onload = function webViewerChangeFileReaderOnload(evt) {
    var buffer = evt.target.result;
    var uint8Array = new Uint8Array(buffer);
    PDFView.open(uint8Array, 0);
  };

  var file = files[0];
  fileReader.readAsArrayBuffer(file);
  PDFView.setTitleUsingUrl(file.name);
  ........

我可以使用这段代码来帮助读取和提取图像文件吗?

EN

回答 2

Stack Overflow用户

发布于 2016-10-04 22:50:20

例如,如果您使用pdf.js打开一个页面

代码语言:javascript
复制
PDFJS.getDocument({url: <pdf file>}).then(function (doc) {
    doc.getPage(1).then(function (page) {
        window.page = page;
    })
})

然后,您可以使用getOperatorList搜索paintJpegXObject对象并获取资源。

代码语言:javascript
复制
window.objs = []
page.getOperatorList().then(function (ops) {
    for (var i=0; i < ops.fnArray.length; i++) {
        if (ops.fnArray[i] == PDFJS.OPS.paintJpegXObject) {
            window.objs.push(ops.argsArray[i][0])
        }
    }
})

现在,args将有一个您需要从该页面获取的资源列表。

代码语言:javascript
复制
console.log(window.args.map(function (a) { page.objs.get(a) }))

应该向控制台打印一堆具有data-uri src=属性的<img />对象。这些数据可以直接插入到页面中,或者您可以编写更多的脚本来获取原始数据。

它只适用于嵌入式JPEG对象,但这只是一个开始!

票数 20
EN

Stack Overflow用户

发布于 2022-02-02 08:20:53

下面是从pdf中获取图像并将alpha通道添加到Uint8ClampedArray以显示图像的工作示例的link。它在画布中显示图像。

代码示例:https://codepen.io/allandiego/pen/RwVGbyj

从canvas获取数据url,以便能够在img标签中显示:

代码语言:javascript
复制
const canvas = document.createElement('canvas');
canvas.width = imageWidth;
canvas.height = imageHeight;
const ctx = canvas.getContext('2d');
ctx!.putImageData(imageData, 0, 0);
const dataURL = canvas.toDataURL();
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18680261

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档