首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何读取PDF文件

如何读取PDF文件
EN

Stack Overflow用户
提问于 2012-05-16 16:29:42
回答 1查看 6.7K关注 0票数 0

除了使用ADO之外,是否还有其他方法可以使用VB6从PDF文件中提取数据?我已经成功地在不使用Acrobat Reader的情况下使用VB6打开了PDF文件,但我的项目的下一步需要读取PDF文件并从中找到数据。例如,哪些页面显示“水泥”一词?

EN

回答 1

Stack Overflow用户

发布于 2012-05-16 21:12:00

通常,您将需要依赖于外部库。一个纯粹的VB解决方案(即以文本的形式读取文件并自己处理)不是你在一周内就能完成的。

您可以通过自动化使用Adobe Acrobat。一个让你入门的例子就是http://www.freevbcode.com/ShowCode.asp?ID=7066。但是请注意,Adobe Reader是不够的,您确实需要完整的Acrobat。还有其他流行的PDF阅读库(例如poppler),但是你可能很难在VB6中使用这些库。

一般来说,你成功的机会取决于你所说的“提取”的意思。简而言之,PDF是一种纯粹的描述性格式,没有元信息。例如,文件包含“在(x1,y1)处放一个A;在(x2,y2)处放'foo‘”等指令。读取表或任何类型的结构化信息都需要大量的启发式方法。

最好的做法可能是尝试以更适合的数据格式(纯文本、XML或其他格式)提取数据。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10614715

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档