我用tensorflow,keras,py手电筒建立了几个CNN,用于识别图像中的文本/数字/对象。我现在想知道的是如何识别纸上用钢笔或铅笔圈起来的数字。因此,在一张纸上,有两排6组的数字,有人会通过,2-3组数字,我希望能够拍张照片或者扫描这张纸,并且有一个模型能够识别出哪个数字集被圈起来。什么是开始做这件事的最好方法?
发布于 2019-02-10 01:32:55
您所描述的问题称为对象本地化问题。目前使用的主要DNN结构包括R和相关算法以及YOLO算法.这是计算机视觉中一个经过充分研究的问题。你可以在网上找到很多信息。
https://datascience.stackexchange.com/questions/45318
复制相似问题