我已经训练了一个50,500,500,5个神经网络,输入层有50个神经元,输出层有5个神经元。layer2中的偏差如下所示

为什么layer2中的偏差分布变化如此剧烈?
( layer1中的偏差分布在每一步中几乎是相同的。
有人能解释这种现象吗?
发布于 2018-06-21 06:06:23
你所看到的几乎可以肯定是过度拟合。这不是你实现中的bug,而是你理解上的问题。这个1055神经元多层感知器(MLP)的权重约为6.25M (取决于您的实现)!这个容量足以记忆几乎任何模式。您在直方图中看到的是偏差参数的迁移,以适应您的数据。它只发生在最后一层,因为仅最后一层中的偏置项就足以记住数据。从非常清晰的参数集中判断,我猜你是在一个相当小的数据集上进行训练。这就是你的MLP在记忆数据点时的样子。参考你的训练和验证损失与时期的曲线,以确认这一假设。
https://stackoverflow.com/questions/50950793
复制相似问题