我想要创建一个自动语音识别系统,它将从数据库中的单词列表中识别一个正确的单词。我已经看到CMUSphinx可以用来解决这个问题。我已经尝试过演示应用程序,但它并没有给出预期的结果。
我不知道如何选择正确的声学模型,字典文件,语言模型。对于一个词来说,语言模型是必要的吗?
印度英语有现成的声学模型吗?
发布于 2014-09-03 08:19:25
我已经尝试过演示应用程序,但它并没有给出预期的结果。
你需要提供更多关于你尝试过什么的细节。pocketsphinx支持关键字定位,您可以在这里检查它。
http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx
要测试关键字定位,您可以尝试:
pocketsphinx_continuous -infile file.wav -keyphrase "hello world" -kws_threshold 1e-40它将在文件中查找关键短语。
I don't know how to choose the correct acoustic model, dictionary file, language model. For a single word is the language model necessary?没有必要建立语言模型。对于声学模型和字典,您可以选择最适合您的语言。
印度英语有现成的声学模型吗?
目前还没有印度英语的模式,但你可以尝试美英模式,只要一个单词就行了。
https://stackoverflow.com/questions/25637872
复制相似问题