首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >只需一幅训练图像的二维目标检测

只需一幅训练图像的二维目标检测
EN

Stack Overflow用户
提问于 2017-11-08 08:19:50
回答 2查看 137关注 0票数 1

视觉系统被给予一个单一的训练图像(例如,一张2D的艺术品),并且询问该作品是否在新拍摄的照片中。新拍摄的照片可以包含许多其他物体,当艺术品呈现时,它必须面对,但可能会被遮挡。

体位空间是x,y,旋转和尺度。艺术品可能是高度对称的,也可以是不对称的。

处理这类问题的最新进展如何?

我试过/考虑了以下几种选择,但它们都有一些问题。如果我的论点无效,请纠正我。

  1. 深度学习(rcnn/yolo):需要大量的标记数据,这意味着每件新的艺术品都需要大量的人类劳动。
  2. 传统机器学习(SVM,随机林):与上面相同
  3. sift/surf/orb + ransac或投票:当艺术品对称时,匹配的功能大多是不正确的。在ransac/表决阶段需要大量时间。
  4. 广义hough变换:对于投票表来说,状态空间太大了。金字塔是可以应用的,但是很难为不同类型的艺术品选择一些通用的阈值来进行金字塔的下移。
  5. 倒角匹配:状态空间太大。在整个状态空间中搜索需要太多时间。
EN

回答 2

Stack Overflow用户

发布于 2017-11-09 16:26:03

对象检测需要同一类的大量标记数据才能很好地进行泛化,在您的设置中,只使用单个实例就不可能训练一个网络。

我假设在您的情况下,在线对象跟踪器可以工作,至少尝试一下。有些复杂的对象跟踪器可以像暹罗这样工作得很好。代码在github是开源的,您可以查看这段视频来查看它的性能。

在线对象跟踪:给定视频帧中目标对象的初始化状态(例如位置和大小),跟踪的目的是估计后续帧中目标的状态。-来源-

票数 1
EN

Stack Overflow用户

发布于 2017-11-17 06:57:22

您可以尝试使用传统的基于特征的图像处理算法,这可能使真正的正模板匹配达到下降的精度。

给定模板图像,如问题中所示:

  1. 首先,放大图像,将所有紧密相连的部件连接起来。
  2. 找到上面得到的连通物体的凸包,这会给你一个多边形。
  3. 使用上面的多边形边缘长度信息,如(最大长度/分钟长度)比率作为模板的特征。
  4. 同时发现多边形中的像素密度作为第二特征。

我们现在有两个特征。

场景图像特征向量:

同样地,在场景图像中,使用扩展后的连通分量识别,定义每个连接对象周围的凸包(多边形),并为每个对象定义特征向量(边缘信息,像素密度)。

现在,像往常一样,在场景图像特征向量数据中搜索具有最小特征距离的模板特征向量(也可以使用一定的上限距离阈值来避免虚假的正匹配)。

这应该提供真实的正匹配,如果在现场图像可用。

异常:此方法不适用于被遮挡的对象。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47174676

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档