有没有可能用iText7获得PDF字段的Tab键顺序?
您可以在Acrobat中定义Tab键顺序,但在iText7库中似乎无法获得该Tab键顺序。
我正在编写一个从PDF文件中提取字段的应用程序,并希望根据PDF中定义的Tab键顺序对这些字段进行排序。
发布于 2019-07-08 05:07:01
页面上字段(或更多)的顺序由页面字典中的Tabs条目确定。它的值指定为:
(可选;PDF1.5)一个名称,指定用于页面上批注的tab键顺序(请参阅12.5“批注”)。可能的值应为R(行顺序)、C(列顺序)和S(结构顺序)。从PDF 2.0开始,可能的值还包括A(注解数组顺序)和W(小部件顺序)。注释数组顺序是指在页面字典的注释条目中枚举的注释的顺序(参见“表31 -页面对象中的条目”)。小部件顺序意味着使用相同的数组顺序,但要进行两次传递,第一次只选择小部件注释,第二次选择所有其他注释。
(ISO 32000-2,表31 -页面对象中的条目)
因此,要执行根据PDF中定义的Tab键顺序提取要排序的字段的任务,您必须读取相关页面的此值,并根据该值相应地分析注释坐标、结构树或注释数组。
顺便说一下,对于具有多个小部件的字段,这意味着它们也有多个制表符位置;因此,对于某些文档,根据PDF中定义的制表符顺序导出要排序的字段可能是不可能的。
https://stackoverflow.com/questions/56846829
复制相似问题