我在寻找模型中的数据泄漏。我在进行掩蔽操作之前使用了tf.layers.dense,并且担心模型可能只是学习在输入张量的中间维中转换位置。
当我有一个输入张量x = tf.ones((2,3,4))时,tf.layers.dense(x,8)会把x压平到一个有2*3*4=24输入神经元和2*3*8=48输出神经元的完全连接层上,然后再将其重塑为[2,3,8],还是会创建有4个输入和8个输出神经元的2*3=6完全连接层,然后将它们连接起来?
发布于 2018-10-18 19:48:18
对于Keras稠密层,另一个答案中已经提到它的输入不是平坦的,而是应用在输入的最后一个轴上。
对于TensorFlow稠密层,它实际上是继承自Keras稠密层,因此,与Keras稠密层一样,它的输入也是它被应用在最后一个轴上。。
https://stackoverflow.com/questions/52873329
复制相似问题