我一直在执行一个开源的文本到语音系统奥斯辛.它使用前馈DNN进行声学建模。运行声学模型后得到的错误图如下所示:

以下是一些相关信息:
有人能指点我改进这个模型的方向吗?我想是因为身体不适吧?我该怎么做才能避免这种情况?增加数据?还是改变批次大小/时间/正则化参数?提前谢谢。
发布于 2019-08-22 06:11:43
正如学习是一团糟的指出,更多的信息将有助于提出有用的建议。模型的大小(就可训练参数而言)是多少?另外,你有多少培训数据?但是,您可以尝试这样的方法: a.辍学--这是一种正则化方法,它是集合学习的一种代理。不知道你是不是在用这个。b.较小的批次: 8/16/32 -从经验上看,在测试/验证集上,较小的批次在泛化意义上找到了更好的最小值。见https://arxiv.org/pdf/1609.04836.pdf。c.保持相同的参数数,更深的模型(更多的层)被发现能更好地推广。见https://arxiv.org/abs/1706.10239。
https://datascience.stackexchange.com/questions/55828
复制相似问题