首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >狗猫神经网络拟合

狗猫神经网络拟合
EN

Stack Overflow用户
提问于 2018-06-29 19:20:28
回答 1查看 96关注 0票数 0

不一定要进入它的代码,但更多地关注原则,我有一个问题,我认为什么是不合适的。

如果我在训练一个网络,识别一个图像是否是狗的真伪,我可能有4万张图像,所有的狗图像都被标记为1,而所有其他的图像都被标记为0--我能做什么来保证准确性,这样,如果这些图像中可能有5,000张是狗,网络就不会从训练中“懒散”地表现出来,同时也给狗贴上接近0比1的标签?

例如,这个问题的主要目的是,如果一幅图像真的是一只狗的话,就能准确地识别出来,而不是对其他的图像太在意,除了它们不是狗。另外,我希望能够保留猜测正确的可能性,因为这对我的目的非常重要。

我唯一能想到的两件事是:

  1. 在网络中有更多的节点,或者
  2. 有一半的图像是狗(所以使用10,000张图片,其中5,000是狗)。

但我认为这第二个选项可能会给狗一个不成比例的很大的机会成为测试数据的输出,这将破坏这个网络的准确性和整个目的。

我相信这一点以前已经解决过,所以即使是在正确的方向点也会受到高度赞赏!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-29 20:05:57

因此,您有一个二进制分类任务,其中两个类在数据集中以不同的频率出现。大约1/8是“狗”,7/8是“没有狗”。

  1. 为了避免对一个或另一个类有偏见的学习,您必须对您的培训、验证和测试数据进行分层,以便在每个子集中保留这些部分。
  2. 您说您希望“保留猜测正确的概率”--我假设您的意思是要将"dogness"-probability作为输出变量进行计算。这是一个简单的软极输出层,有两个输出:第一个是“狗”,第二个是“非狗”。这是解决分类问题的典型方法,不管您需要区分多少类。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51108160

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档