除了使用ADO之外,是否还有其他方法可以使用VB6从PDF文件中提取数据?我已经成功地在不使用Acrobat Reader的情况下使用VB6打开了PDF文件,但我的项目的下一步需要读取PDF文件并从中找到数据。例如,哪些页面显示“水泥”一词?
发布于 2012-05-16 21:12:00
通常,您将需要依赖于外部库。一个纯粹的VB解决方案(即以文本的形式读取文件并自己处理)不是你在一周内就能完成的。
您可以通过自动化使用Adobe Acrobat。一个让你入门的例子就是http://www.freevbcode.com/ShowCode.asp?ID=7066。但是请注意,Adobe Reader是不够的,您确实需要完整的Acrobat。还有其他流行的PDF阅读库(例如poppler),但是你可能很难在VB6中使用这些库。
一般来说,你成功的机会取决于你所说的“提取”的意思。简而言之,PDF是一种纯粹的描述性格式,没有元信息。例如,文件包含“在(x1,y1)处放一个A;在(x2,y2)处放'foo‘”等指令。读取表或任何类型的结构化信息都需要大量的启发式方法。
最好的做法可能是尝试以更适合的数据格式(纯文本、XML或其他格式)提取数据。
https://stackoverflow.com/questions/10614715
复制相似问题