我能够得到一个合理的精确度与8khz音频文件。现在,如果可以的话,我想尝试更高的抽样率。
通过查看此页上可用的声学模型,他们列出了:
en-us-8khz.tar.gz
en-us-semi-full.tar.gz
en-us-semi.tar.gz
en-us.tar.gz 说8khz的那个很明显是8khz抽样率的那个,但是另外三个呢?它们匹配的样品率是多少?
如果我使用一个16 use音频文件,我需要使用这些声学模型中的哪一种?
在文件名中的抽样率的范围内,如何计算出声学模型的采样率?
发布于 2014-12-19 21:31:20
您可以在模型文件夹中打开文件feat.params并查找-upperf参数。在8khz模型中,-upperf通常是3500或4000。对于16 than型号,-upperf超过4000,通常是6800。
https://stackoverflow.com/questions/27571898
复制相似问题