RobinHerbots/Inputmask 状态:活跃; intl-tel-input: 仓库:https://github.com/jackocnr/intl-tel-input 状态:活跃 text-mask : 仓库:https://github.com/text-mask/text-mask 状态:活跃 cleave.js: 仓库:https://github.com/nosir/cleave.js
具体来说,作者提出了文本遮挡(Text-Mask)范式,将遮挡中的信息压缩成紧凑的文本序列,由VLMs高效学习。 Hybrid Supervision 作者提出了一种混合监督方法,同时利用Text-HBB、Text-OBB和Text-Mask来全面提高VLMs的视觉定位能力。 GGL可以表示为: where 表示密集的文本化信号,可以表示为 Text-OBB 或 Text-Mask。图3 展示了 PAL 和 GGL 的示例。 当 Text-Mask 的分辨率设置为 16 时,GeoGround 达到了最佳性能。这可能是因为在更高的分辨率上训练变得更加困难。 表10比较了作者在DIOR-RSVG测试集上提出的Text-Mask与Text4Seg的性能。HBB预测是通过计算分割 Mask 的边界来获得的。
html: