不一定要进入它的代码,但更多地关注原则,我有一个问题,我认为什么是不合适的。
如果我在训练一个网络,识别一个图像是否是狗的真伪,我可能有4万张图像,所有的狗图像都被标记为1,而所有其他的图像都被标记为0--我能做什么来保证准确性,这样,如果这些图像中可能有5,000张是狗,网络就不会从训练中“懒散”地表现出来,同时也给狗贴上接近0比1的标签?
例如,这个问题的主要目的是,如果一幅图像真的是一只狗的话,就能准确地识别出来,而不是对其他的图像太在意,除了它们不是狗。另外,我希望能够保留猜测正确的可能性,因为这对我的目的非常重要。
我唯一能想到的两件事是:
但我认为这第二个选项可能会给狗一个不成比例的很大的机会成为测试数据的输出,这将破坏这个网络的准确性和整个目的。
我相信这一点以前已经解决过,所以即使是在正确的方向点也会受到高度赞赏!
https://stackoverflow.com/questions/51108160
复制相似问题