首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏GoCoding

    PDFium 渲染

    编译 PDFium 使用预编译库:https://github.com/bblanchon/pdfium-binaries 不然,参考 PDFium / README[4] 自己编译,实践步骤如下: # ://pdfium.googlesource.com/pdfium.git gclient sync cd pdfium # get deps # on linux, install additional ninja -C out/Release pdfium # pdfium_test ninja -C out/Release pdfium_test # run sample: pdf > ppm 阅读 PDFium / Getting Started[5],了解如何初始化 PDFium 及载入文档。 /pdfium.googlesource.com/pdfium/ [5]PDFium / Getting Started: https://pdfium.googlesource.com/pdfium/

    3.4K10编辑于 2021-12-06
  • 来自专栏腾讯玄武实验室的专栏

    Chrome PDFium 整数截断漏洞分析

    漏洞简介 chromium:697847 是 PDFium 里面由于 整数截断 引起的一个堆溢出漏洞(将 unsigned long 赋值给uint32),简单记录一下。 漏洞原理: PDFium 使用 zlib 的 inflate 接口解压数据; 在 zlib 中,解压后的数据的大小使用 unsigned long类型的变量 total_out来存储; PDFium 使用 uint32 类型的变量来接收 total_out 的值; 在 64 位环境中,当解压后的数据大小超过 4GB 时(即超过uint32的范围)会产生截断; 后续 PDFium 使用截断后的值分配堆块并拷贝解压后的数据 漏洞分析 2.1 崩溃信息 在 64 位 Ubuntu 上开启 AddressSanitizer 编译 PDFium,使用编译出来的 pdfium_test测试原贴提供的 PoC 文件,可以看到如下崩溃信息 #0 0x4a5dac in __asan_memcpy #1 0x8e5d80 in (anonymous namespace)::FlateUncompress() pdfium

    1.8K01发布于 2017-08-17
  • 来自专栏X#(XSharp)

    pdfium-vfp:隐藏着 Unicode 问题的部分解决方案

    它隐藏在 VFPX 的 pdfium-vfp 项目中...... Follow me,认识不一样的 VFP!

    40010编辑于 2024-12-06
  • 来自专栏DotNet NB && CloudNative

    Docnet:轻量高效的 .NET PDF 操作库

    它封装了 Google Chromium 使用的 PDF 渲染引擎 PDFium,提供了强大的 PDF 文档读取、解析、渲染等功能,并且完全支持 .NET Standard 2.0,适用于 Windows 但图像渲染示例依赖 System.Drawing.Common,在 Linux/macOS 上运行时需安装 libgdiplus: sudo apt install libgdiplus 另外,建议手动指定 PDFium 包地址:https://www.nuget.org/packages/Docnet.Core 总结 相比于 iText、PdfSharp 等传统 PDF 处理库,Docnet 更加轻量、高效,且依托于 PDFium

    49110编辑于 2025-07-17
  • 来自专栏WPF

    C#如何加载嵌入到资源的非托管dll

    Assembly.GetExecutingAssembly().Location); var dllPath = Path.Combine(folderPath, $"{nameof(Resource.pdfium File.Exists(dllPath)) File.WriteAllBytes(dllPath, Resource.pdfium); LoadDll

    1.6K20发布于 2021-05-17
  • 来自专栏深度学习与python

    Nvidia Ingest 让从文档中提取结构化信息更简单

    对于 PDF 文档,Ingest 可以使用 pdfium、Unstructured.io 或 Adobe 的内容提取服务。 . \ --task='extract:{"document_type": "pdf", "extract_method": "pdfium", "extract_text": true, "extract_images

    40000编辑于 2025-02-18
  • 来自专栏Excel催化剂

    Excel催化剂开源第31波-pdf相关功能实现及类库介绍

    这个轮子又依赖于PDFium轮子,PDFium好像分86和64两个版本。 源代码节录 直接在nuget上搜PDFium会有多个版本,用PdfiumViewer搜索,好像可以搜索到不分86和64的版本,现在用着是它,没测试过32位机器是否不会出问题。

    99520发布于 2021-08-19
  • 来自专栏翩翩白衣少年

    OCR 界的“超级小钢炮”!LightOnOCR-2-1B 发布:1B 参数,千页成本不到 7 分钱!

    mm-processor-cache-gb 0 --no-enable-prefix-caching 代码示例: import base64 import requests import pypdfium2 as pdfium 2412.13663" pdf_data = requests.get(pdf_url).content # Open PDF and convert first page to image pdf = pdfium.PdfDocument

    26310编辑于 2026-03-16
  • 来自专栏深度学习与python

    死磕PDF技术20年:海外赚钱国内上市,码农创始人终成亿万富翁

    2014 年,谷歌开源了一个名为 PDFium 的项目,主要是为了包装到 Chrome 浏览器里去,以便开发人员能够将其纳入各种平台应用,向用户提供包括阅读、编辑、创建、管理和保护 PDF 文档的功能。 PDFium 库的重要组成部分——渲染引擎,就使用了福昕软件的 PDF 技术,这也是福昕的核心技术之一。 获得亚马逊和谷歌的背书之后,福昕软件发展明显更为顺遂。

    74620发布于 2020-09-14
  • EmbedPDF 封神!这款开源神器,让 PDF 前端集成告别折腾

    UI+高性能,体验升级 EmbedPDF的默认 Viewer 不仅颜值在线,操作体验也远超传统方案: UI设计现代简洁,支持主题配置,能轻松融入项目设计体系 操作流畅顺滑,滚动、缩放、批注无延迟 基于PDFium

    98510编辑于 2026-01-22
  • 来自专栏编程进阶实战

    .NET 使用 DocNET 库快速高效的操作 PDF 文档

    它是基于 Chromium 所使用的 PDFium C++ 库开发的 .NET Standard 2.0 封装库。

    34010编辑于 2025-07-22
  • 使用spaCy处理PDF和Word文档的技术指南

    /document.pdf"# 加载并将PDF页面转换为图像pdf = pdfium.PdfDocument(DOCUMENT_PATH)page_image = pdf[2].render(scale

    21810编辑于 2025-10-30
  • 来自专栏公共互联网反网络钓鱼(APCN)

    当“我已付款两次”成为钓鱼暗号:Booking.com生态遭系统性渗透,全球酒店与旅客陷信任危机

    例如,攻击者分发一个名为AcroRd32.exe(Adobe Reader主程序)的合法签名文件,但同目录下放置恶意pdfium.dll。 onmatch="include"><Image condition="end with">AcroRd32.exe</Image><CommandLine condition="contains">pdfium.dll

    23910编辑于 2026-01-17
  • PDF防传播防复制一机一码制作教程版权在我手

    PDF保护; 文档人性化,软件提供文档可以试用浏览,未注册用户,可以浏览前面特定页数或者完全不给于未注册用户的浏览权限,而浏览多少页完全由用户决定,此外FIRC团队自主研发专用阅读器,基于强大谷歌开源pdfium

    40710编辑于 2025-07-18
  • 1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!

    引擎,支持中/英/德/法/日等 100+ 语言识别,可配置多语言混合识别二、技术架构解析模块技术选型功能说明文档转换Pandoc 2+处理 Office/EPUB/Markdown 等格式PDF处理pdfium2

    2K10编辑于 2025-03-23
  • 来自专栏量子位

    一起来找BUG!谷歌推出全新漏洞悬赏平台,不会的还管教

    我们就以Chrome为例: 首先是漏洞查找范围: Canary版Chrome由于谷歌本身就会频繁回归测试,所以尽量多找Stable、Beta、Dev版上的bug; 谷歌提供或使用的第三方组件 (如PDFium

    93640编辑于 2023-03-10
  • 来自专栏DotNet NB && CloudNative

    C#/.NET/.NET Core优秀项目和框架2025年7月简报

    它是基于 Chromium 所使用的 PDFium C++ 库开发的 .NET Standard 2.0 封装库。

    42710编辑于 2025-09-02
  • 来自专栏跟Qt君学编程

    Qt 5.15长期支持版本正式发布

    技术预览模块 Qt PDF 基于Qt WebEngine的共享Pdfium版本。 在同一平台上可用Qt WebEngine以及iOS可用。

    5.3K20发布于 2020-06-01
  • 来自专栏编程进阶实战

    C#/.NET/.NET Core优秀项目和框架2025年7月简报

    它是基于 Chromium 所使用的 PDFium C++ 库开发的 .NET Standard 2.0 封装库。

    44910编辑于 2025-08-06
  • 使用Nemotron构建文档处理RAG管道

    extract_charts=True, # 图表裁剪 extract_images=False, # 专注于图表/表格 extract_method="pdfium

    9510编辑于 2026-04-21
领券