搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

仅使用"sphinx4“调整声学模型

是否可以仅使用"sphinx4“来调整声学模型？我已经检查了网站，但提到的命令是为pocketShphinx "“。我还检查了一些其他的解决方案，但都使用了pocketsphinx。

浏览 6修改于2017-02-14得票数 0

1回答

电话在声音模型中丢失了

pocketsphinx_continuous -infile my audio -dict my_dictionary -jsgf my_jsgf时错误：“auto.c”，第195行:第2行:电话'I‘在声学模型中丢失；忽略了单词'Bismi(2)’错误：“auto

浏览 2修改于2020-06-20得票数 0

1回答

在sphinx-4上使用HTK声学模型

我一直在使用sphinx-4作为语音识别工具，我还在尝试学习这个工具。我有一个用HTK开发的阿拉伯声学模型。我想知道如何在Sphinx-4中使用这个声学模型。

浏览 4提问于2012-06-13得票数 0

回答已采纳

2回答

我有一个带有音乐声学特性的JSON文件(大约1GB)。仪器”：4.44999999999799457E-06，“活性”：0.0100000000000197，“价比”“节奏”：123.0379999999999967，"time_signature":"4"“活性”：0.36499999999999999112，“价”：0.49599999999999999645，“节拍”：104.98799999999999955，"time_signature":"4"“活

浏览 0提问于2018-10-27得票数 1

回答已采纳

1回答

PocketSphinx python和设置声学模型？

我正在阅读上的这份指南，其中提到我需要三个项目来进行语音识别:声学模型、语言模型和语音字典。但是我不明白我应该在哪里指定声学<

浏览 0提问于2012-12-01得票数 5

回答已采纳

1回答

什么是上下文相关的声学建模？

我试图弄清楚什么是上下文依赖/依赖声学建模。我一直在试着阅读一些关于它的报纸，但是我对这个概念仍然有些动摇。正如我目前所理解的(这可能是错误的)，上下文相关的声学模型是根据在序列中发生音素的数据进行训练的声学模型。例如，用单词对目标语言进行训练，因此音素是由前后发生的音素所决定的，给出了上下文。而独立的语境将是一个声学模型，有些是如何与音素隔离地训练的。

浏览 10提问于2016-05-22得票数 2

回答已采纳

1回答

Microsoft自定义语音服务接收音频文件并逐个转录

我创建了一个自定义声学模型(它包括压缩文件中的一组语音数据文件，以及每个音频文件的转录，由文本文件中的一个选项卡隔开)并导入它。但计划如下:将微软提供的OOB声学模型与自定义语音合并。尝试了WPF示例()，它返回4个语音到文本转录.我们想要的是为每个消息(一个音频文件)，用户提供这4个转录，他将选择哪一个是正确的。我们如何以编程的方式导入声学数据并为其创建一个模型--(而不是手动上传整个音频压缩文件和带有文件名和转录等键值对的文本文件)？(每次编辑现有的声学数据，而不是导入新的数据) 或

浏览 7修改于2017-02-23得票数 0

回答已采纳

2回答

语音到文本引擎的声学模型训练

训练声学模型的步骤是什么？数据(音频)的格式包括其长度和其他特征。如果有人能提供一个简单的例子，如何训练一个声学模型，这将是非常感谢。

浏览 0修改于2019-04-04得票数 0

回答已采纳

1回答

在python中拆分midi文件中的打击乐器

我想提取的声学低音鼓的midi文件和输出它(声学低音drum.mid)在python。例如，我有很多midi文件，然后我想提取其中的声学低音鼓部分，并在编程中输出它。

浏览 3提问于2016-12-11得票数 0

1回答

Drupal 7公开的过滤器显示文本

其中一个列表显示的完全是我想要的，那就是图片中显示的声学吉他，但我无法理解为什么其他的过滤器不像声学吉他那样显示。这是一张图片，有人知道我需要更改哪些设置才能显示描述而不是像声学吉他列表那样的类别吗？ 📷

浏览 0提问于2013-12-31得票数 0

1回答

选择后jQuery选择的更改显示

></select> 所以，我喜欢做的是，每当有人选择说“声学”时，我需要能够在jQuery选择的复选框中显示“蓝调声学”。现在，它只显示选定的子类别“声学”时被选中。

浏览 3修改于2013-12-24得票数 0

1回答

如何将voice.csv数据转换成音频wav格式？

数据来自，它还对数据进行了描述： frequencymedian:的平均频率(以kHz计)sd: description)sp.ent:中值频率的标准差sp.ent:熵<编码>H 221<//码><代码>H 122</编码>H 122</编码>谱#EN3#模式中的注记)frequencycentroid:频率质心(见specprop)peakf:峰值频率(跨声学signalminfun:测量的基频频率的最高

浏览 2修改于2019-09-19得票数 2

1回答

如何在java sphinx4项目中导入和使用经过训练的声学模型

我需要帮助做一个java语言的程序，这是一个语音识别程序我有一个经过训练的声学模型我想问你，我如何在我的程序中使用这个经过训练的声学模型我是语音识别平台的新手，我想在netbeans编辑器中工作，所以请给我指令来测试我的声学模型

浏览 6提问于2013-08-27得票数 1

1回答

如何在声学数据集上应用数据增强？

我有一个关于人类声音的小型声学数据集，我想对其进行扩充，然后将其传递给二进制分类器。我熟悉图像的数据增强，但它是如何为声学数据集做的？

浏览 2提问于2020-03-24得票数 0

1回答

我如何区分8 8Khz声学模型和16 8Khz模型？

通过查看上可用的声学模型，他们列出了：en-us-semi-full.tar.gz en-us.tar.gz如果我使用一个16 use音频文件，我需要使用这些声学模型中的哪一种？在文件名中的抽样率的范围内，如何计算出声学模型的采样率？

浏览 3提问于2014-12-19得票数 3

回答已采纳

1回答

Android和AEC上的空中聊天

但是声学回声让我受困于耳机。有了GTalk，我们可以享受免提聊天。这意味着这是可能的。我确信我不是第一个用AIR开发聊天应用的人。什么是这个项目的正确方法，以消除声学回声？

浏览 3修改于2012-01-30得票数 1

回答已采纳

1回答

Url路径别名没有使用“来自URL上下文过滤器的原始值”

例如:如果我在墙阻尼/drupal/声学，它将拉出所有的节点标签“声学”。问题是: Drupal不读取路径别名。墙阻尼/drupal/声学的实际地址类似于壁湿/节点/59。

浏览 0提问于2012-09-19得票数 2

1回答

认知服务-自定义语音C++

有一种使用声学数据模型和自定义语言训练自定义语音的方法，以达到更高的训练精度。我怎样做呢？到目前为止，我已经成功地在STT的声学和语言模型中使用了自定义语音，或者使用了用于语音的LUIS订阅ID来识别意图，但无法将我的LUIS speech自定义模型链接到意图。我对以前的必应STT SDK不感兴趣，因为我需要这些自定义声学模型和语言模型作为我的用例。

浏览 1提问于2018-07-10得票数 0

1回答

从头创建声学模型或调整现有声学模型

当采用说话人15分钟语音的声学模型时，错误率太高(从6-10个单词中识别出正确的1个单词)。我所做的: 1.我已经将阿拉伯语单词转录成俄语，并将它们放入字典中。2.我已经尝试了ru4sphinx项目的旧模型msu_ru_zero.cd_cont_2000和cmusphinx-ru-5.2的新模型(目前最新的俄语声学模型)。只有很少的(40个中的4个)音频音轨改编失败，“align audio to transcript"，其他的都没有错误。此外，在bw命令使用之后的报告中，有220个感应器不在自适应音轨中。或者我

浏览 1修改于2017-01-10得票数 0

3回答

有没有一种基于Java的光线跟踪模型，可以用于水下声学？

我正在寻找一个开源的基于Java的光线追踪系统，适用于水下基于光线的声学建模。这样的软件包可能类似于高斯射线束(GRAB)的综合声学系统仿真(CASS)，但我更喜欢开源的、免费使用或自由修改的模型，我可以在开放论坛(例如JavaOne)的演示中使用它。不太理想的是基于Java的标准光线跟踪包(光学或声学)，它可以处理通过介质的不同速度。另一种说法是折射率在整个介质中以连续的方式变化(尽管它的一阶导数可能不是连续的)。

浏览 10修改于2008-09-20得票数 3

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

仅使用"sphinx4“调整声学模型

电话在声音模型中丢失了

在sphinx-4上使用HTK声学模型

JSON文件不读熊猫

PocketSphinx python和设置声学模型？

什么是上下文相关的声学建模？

Microsoft自定义语音服务接收音频文件并逐个转录

语音到文本引擎的声学模型训练

在python中拆分midi文件中的打击乐器

Drupal 7公开的过滤器显示文本

选择后jQuery选择的更改显示

如何将voice.csv数据转换成音频wav格式？

如何在java sphinx4项目中导入和使用经过训练的声学模型

如何在声学数据集上应用数据增强？

我如何区分8 8Khz声学模型和16 8Khz模型？

Android和AEC上的空中聊天

Url路径别名没有使用“来自URL上下文过滤器的原始值”

认知服务-自定义语音C++

从头创建声学模型或调整现有声学模型

有没有一种基于Java的光线跟踪模型，可以用于水下声学？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐