首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在C#中提取Apache FOP创建的PDF?

如何在C#中提取Apache FOP创建的PDF?
EN

Stack Overflow用户
提问于 2011-10-01 04:44:49
回答 1查看 559关注 0票数 0

我在c#项目中遇到了一个问题。我想提取Apache FOP生成的PDF文件编程没有任何第三方应用程序。我尝试使用许多库,如PDFBox,IKVM,PDF2Text,ITextSharp,PDFSharp来提取PDF文件,但都失败了。当我将FOP生成的PDF提取到文本文件中时,我得到了许多正方形符号和其他纠缠在一起的字符。

我的问题是,如何在C#中提取FOP生成的PDF文件?有没有可以做到这一点的库(写成C#)?

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2011-10-01 16:13:52

使用Identity-H编码的字体直接使用字形索引在页面上显示文本。这些字体需要字体字典(在PDF文件中)中的ToUnicode条目才能支持文本提取,否则不可能。检查Apache FOP,看看它是否具有在字体字典中包含ToUnicode条目或使字体提取友好的设置。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7615903

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档