搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏IMWeb前端团队
Functional JavaScript 之 Transducer
什么是 Transducer 在函数式编程中，Transducer 是一种用于处理数据的高效、可组合且不会产生的中间数据的函数。借助 Transducer 的思想，能够将 map、filter 等一系列处理数据的函数组合成不产生中间数据的高效的函数。 "); Benchmark 结果（Node v8.9.1，macOS 10.13.3，i7 2.5 GHz，16GB）： With transducer: 50.254ms Without transducer : 89.749ms 在这个例子中，使用 Transducer，通过简单的函数组合，提升了 44% 的性能！ Code 下面是实现 Transducer 的所有代码，只需要三个函数！
64310发布于 2019-12-03
来自专栏人工智能前沿讲习
使用RNN-Transducer进行语音识别建模【附PPT与视频资料】
RNN-Transducer针对CTC的不足，进行了改进，使得模型具有了端到端联合优化、具有语言建模能力、便于实现Online语音识别等突出的优点, 更加适合语音任务，值得引起大家的重视。田正坤 Introduction ---- RNN-Transducer模型实际上是在CTC模型的一种改进。 Exploring architectures, data andunits for streaming end-to-end speech recognition withRNN-transducer
1.9K20发布于 2020-05-11
来自专栏函数式编程语言及工具
Scalaz（48）－ scalaz-stream: 深入了解-Transducer: Process1-tee-wye
有了数据源Source后我们可能需要对Source提供的数据O进行加工处理，这就是transducer的功能了。我们先看看Transducer的类型款式： type Process1[-I,+O] = Process[Env[I,Any]#Is, O] 从类型参数来看transducer不会产生任何的副作用，它的作用应该是把接收到的数据元素 transducer不会主动产生任何数据而是被动接收输入数据I，所以Process1类型的await函数被称为await1，款式如下： /** The `Process1` which awaits a 实际上pipe就是Process组合函数，我们用它来把Source和Transducer、Transducer与Transducer对接起来。这样我们就可以保证Source和Transducer都是功能单一的函数组件了。只要连接上一个数据源，我们就可以对它发出的元素进行转换处理。
1.3K50发布于 2018-01-05
来自专栏iKcamp
翻译连载 | 附录 A：Transducing（下）－《JavaScript轻量级函数式编程》 |《你不知道的JS》姊妹篇
有一个特殊的标签：transducer。给 transducer 提供组合函数产生组合的 reducer： // TODO：检查 transducer 是产生 reducer 还是它本身就是 reducer var transducer = 工具来为我们做这些步骤： function transduce(transducer,combinationFn,initialValue,list) { var reducer = transducer 该片段中的组合函数被称为 transformer ，而不是 transducer。使用 transducer 进行单次 reduce(..) 调用比追踪多个 reduce(..) 调用更容易理解。
1.2K80发布于 2018-01-04
来自专栏mathor
Human Language Processing——RNA&RNN-T&MochA
然而，在实际的语音识别任务中，却可能存在输入一个token，需要输出多个token的情况 RNN-T RNN Transducer就是为了克服CTC和RNA输入一个vector，只输出一个token的问题而设计的 Neural Transducer 前面的CTC、RNA在解码阶段，都是输入一个vector，输出一个token，是1v1的输入-输出方式； RNN-T是输入一个vector，输出多个token，是1vN 这就是Neural Transducer的思路 ? Neural Transducer的改进主要是在解码的输入端。 Neural Transducer做了实验发现，没有注意力时，窗口一长，结果就会很糟糕。但用了注意力后，窗口大小又没那么重要。 MochA CTC、RNA、RNN-T、Neural Transducer都有一个相同的问题，就是\phi。因为我们在数据标注的时候很难插入\phi。
1.4K10发布于 2020-07-28
来自专栏caoqi95的记录日志
医疗相关 EDF 文件查看及读取
digital_max': 2047, 'digital_min': -2048, 'prefilter': 'HP:0.5Hz LP:100Hz [enhanced cassette BW]', 'transducer digital_max': 2047, 'digital_min': -2048, 'prefilter': 'HP:0.5Hz LP:100Hz [enhanced cassette BW]', 'transducer digital_max': 2047, 'digital_min': -2048, 'prefilter': 'HP:0.5Hz LP:100Hz [enhanced cassette BW]', 'transducer physical_min': -2048.0, 'digital_max': 2047, 'digital_min': -2048, 'prefilter': 'HP:0.03Hz LP:0.9Hz', 'transducer ': -5.0, 'digital_max': 2500, 'digital_min': -2500, 'prefilter': 'HP:16Hz Rectification LP:0.7Hz', 'transducer
5.2K11发布于 2019-03-28
来自专栏前端自习课
【JS】446- 你不知道的 map
transducer？？我们找到Ramda的源码，看看这个map究竟都有哪些魔法？ makeMapReducer(plusOne)就是一个transducer。存在方法@@transducer/step的对象就叫做transformer。（transducer还能组合起来，不再展开了，有兴趣的同学可以加群讨论） transducer + transformer = transformer，所以上面两行代码返回的结果依然是一个transformer ，这个transformer的@@transducer/step方法最终效果是下面这样： XMap.prototype['@@transducer/step'] = function(acc, value
1.7K20发布于 2019-12-24
来自专栏阮一峰的网络日志
Reduce 和 Transduce 的含义
var Map = function(f, xf) { return { "@@transducer/init": function() { return xf["@@transducer/init"](); }, "@@transducer/result": function(result) { return xf["@@transducer/result"](result); }, "@@transducer/step": function(result, input) { return xf["@@transducer/step"](result, f(input)); } }; }; 上面代码中，Map函数返回的就是一个 Transformer @@transducer/step：执行变形操作 @@transducer/init：返回初始值 @@transducer/result：返回变形后的最终值所有符合这个协议的对象，都可以与其他 Transformer
1.3K70发布于 2018-04-12
来自专栏人工智能前沿讲习
语音识别的前沿论文，看我们推荐的这4篇
由SFFAI18分享嘉宾白烨同学为大家精选出来的关于语音关键词检索方面的论文以及田正坤同学为大家精选出来的关于利用RNN-Transducer进行端到端声学建模的论文，将带你了解语音识别基本方向。推荐理由：这是百度硅谷实验室的一篇文章，比较了CTC、RNN-Transducer以及Attention模型在原理以及实验性能上的差异，对于想利用端到端模型进行语音识别建模的同学，具有很好的指导意义。文章显示没有额外语言模型的注意力模型以及RNN-Transducer模型性能都超过了基线CTC模型。同时文章还研究了怎么样选取编码器结构。 ? 推荐理由来自：田正坤 4 ???? ? 推荐理由：这是Google2018年的一个工作，文章讲述了丰富的细节来帮助我们如何训练好一个RNN-Transducer网络。文章探索了多种模型结构以及如何利用外部数据。
1.5K20发布于 2020-05-11
来自专栏机器之心
ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA
CTC 是其中最简单、最便于部署的方法，但由于它的性能通常明显落后于 Transducer 和 CTC/AED，这限制了它的实际应用。为此，新一代 Kaldi 团队提出了 Consistency-Regularized CTC (CR-CTC)，可以让纯 CTC 模型的识别性能比肩 Transducer 和 CTC/AED。总的来说，CR-CTC 的性能显著超越标准 CTC，和 CTC/AED 与 Transducer 模型效果相当。另外，挂上 CR-CTC 联合训练，可以进一步提升 CTC/AED 和 Transducer 的性能。在这三个数据集上，我们取得了新的 SOTA 结果。与挂一个 auxiliary head 联合训练相比较想要提升 CTC 系统的性能，一个最直接的方法便是挂一个 AED head 或者一个 Transducer head 联合训练。
1.3K10编辑于 2025-02-08
来自专栏磐创AI技术团队的专栏
PyTorch+Kaldi、专注E2E语音识别，腾讯AI Lab开源轻量级语音处理工具包PIKA
CUDA-Warp RNN-Transducer 对于 RNNT 损失模块，开发者采用了 warp-rnnt（https://github.com/1ytic/warp-rnnt）项目中的 pytorch 数据准备和 RNNT 训练 egs/train_transducer_bmuf_otfaug.sh 包括数据准备和 RNNT 训练。 ., utt_id_1 3 5 7 10 23 train_data_dir= 继续 MBR 训练有了 RNNT 训练模型后，用户可以使用 egs/train_transducer_mbr_bmuf_otfaug.sh 通过以下代码，用户可以轻松执行 LAS 后向重评分训练： --reverse_labels 解码 egs/eval_transducer.sh 是主要的评估脚本，包含解码 pipeline。指定以下两个模型可以实现 LAS 前向与后向重评分： ##########configs##############rnn transducer model rnnt_model=#forward and
1.8K10发布于 2021-01-12
来自专栏大前端（横向跨端 & 纵向全栈）
JavaScript 设计模式学习第十七篇－桥接模式
= new Transducer(transducerType); } Washer.prototype.work = function () { this.motor.run(); this.roller.run(); this.transducer.run(); } // 电机 function Motor(type) { this.motorType = type } Roller.prototype.run = function () { console.log(this.rollerType + '开始工作') } // 变频器 function Transducer (type) { this.transducerType = type + '变频器' } Transducer.prototype.run = function () { console.log (); this.transducer.run(); } } // 电机 class Motor { constructor(type) { this.motorType
74810发布于 2020-11-26
来自专栏函数式编程语言及工具
Scalaz（55）－ scalaz-stream: fs2-基础介绍，fs2 stream transformation
我们知道，纯数据流就是scalaz-stream里的Process1，即transducer，是负责对流进行状态转换的。在fs2里transducer就是Pipe（也是channel），我们一般用through来连接transducer。上面示范中的take,filter等都是transducer，我们可以在object pipe里找到这些函数： 1 object pipe { 2 ... 3 /** Drop `n` elements 我们可以用through来连接这些transducer： 1 Stream(1,2,3).repeat 2 .throughPure(pipe.take(10)) 3 .throughPure( transducer的类型是Pipe，即： type Pipe[F[_],-I,+O] = Stream[F,I] => Stream[F,O] 我们看到Pipe就是一个Function1的类型别名，一个
1.8K60发布于 2018-01-05
来自专栏往期博文
【NLP】自然语言处理学习笔记（一）语音识别
Neural Transducer CTC、RNA、RNN-T都没有用到注意力机制，而LAS用到了。一个朴素的想法是，既然注意力机制有效果，为什么不用呢？于是，Neural Transducer就在RNN-T的基础上，加入了注意力机制。如图所示，Neural Transducer规定一个窗口window，将窗口内的h进行注意力处理，从而选取部分进入到Decoder之中。这个窗口的长度是一个人为给定的超参数。 MoChA:Monotonic Chunkwise Attention Neural Transducer创新性地提出了一个窗口，那么，这个窗口长度是否可以动态变化呢？如图所示，MoCha在Neural Transducer的基础上，单独设置了一个判别器，输入状态z和当前的h，输出yes和no，yes表示窗口在这里截止。
2K41编辑于 2022-06-19
语音识别技术在英语学习中的创新应用
语音识别技术在英语学习中的创新应用技术背景某中心推出的英语学习功能采用先进的语音识别技术，通过 phonetic RNN-transducer 模型预测学习者发音中的音素（语音最小单位）。语码转换）未来发展方向构建支持多语言的统一发音评估模型扩展音调及词汇重音等发音特征诊断持续优化模型准确性和用户体验相关技术论文发表于ICASSP 2023会议，详细方法参见《Phonetic RNN-transducer
26510编辑于 2025-08-26
融合语音识别与语言理解的技术探索
动态内容处理一篇题为“上下文感知的Transformer Transducer语音识别”的论文，探讨了如何在运行时将个性化内容（例如通讯录中的姓名，或智能家电的自定义名称）整合到神经网络模型中的问题。架构图描述：上下文感知模型的架构（在论文中展示）：(a) Transformer Transducer模型；(b) 上下文偏置层；(c) 带有音频嵌入的上下文感知Transformer Transducer
22710编辑于 2025-12-17
来自专栏算法工程师的学习日志
语音识别的一些开源项目整理
https://github.com/librosa/librosa （3）warp-ctc 链接：https://github.com/baidu-research/warp-ctc （4）warp-transducer 链接：https://github.com/HawkAaron/warp-transducer （5）k2 链接：https://github.com/k2-fsa/k2 （6）sctk 链接：GitHub
3.5K30编辑于 2022-07-27
来自专栏机器之心
Attention-lvcsr、Residual LSTM…你都掌握了吗？一文总结语音识别必备经典模型（三）
https://sota.jiqizhixin.com/project/transfomer-transducer收录实现数量：1支持框架：PyTorch Transformer Transducer 使用带权有限状态转录器（Weighted Finite State Transducer，WFST）框架，从一个词级的语言模型建立一个字符级的语言模型。将语言模型有限状态转录器（Finite State Transducer，FST）G与简单拼出每个单词的字母的词典FST L组成。 RNN/Transformer Transducer 架构 RNN-T是一种神经网络体系结构，可以通过RNN-T损失进行端到端训练，将输入序列（如音频特征向量）映射到目标序列。平台收录 Transfomer-Transducer 共 1 个模型实现资源。项目 SOTA！平台项目详情页 Transfomer-Transducer 前往 SOTA！
1K31编辑于 2023-02-23
来自专栏函数式编程语言及工具
Scalaz（46）－ scalaz-stream 基础介绍
Process就是stream转换器（transducer），它可以把一种stream转换成另一种stream。 Process又分以下几类： type Process0[+O] = Process[Nothing,O] /** * A single input stream transducer. emits values of type `O`. */ type Process1[-I,+O] = Process[Env[I,Any]#Is, O] /** * A stream transducer Process1[I,O] <: Tee[I,I2,O]`. */ type Tee[-I,-I2,+O] = Process[Env[I,I2]#T, O] /** * A stream transducer
74570发布于 2018-01-05
来自专栏函数式编程语言及工具
Scalaz（53）－ scalaz-stream: 程序运算器－application scenario
scalaz-stream的数据处理是有序流程，这样可以使我们更容易分析理解程序的运算过程，它的三个大环节包括：数据源（source），数据传换（transducer）及数据终点（Sink/Channel prg1.runLog.run //> res0: Vector[Int] = Vector(19) add10是新增的一个运算步骤，是个transducer s.toDouble * i).toString) }.repeat 2 val prg = (lines |> mul(5)) to outLine 3 prg.run.run 加了个transducer 同时我们应该看到在program的形成过程中transducer multiplyBy是如何用|>与prg组合的。
67990发布于 2018-01-05

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页

点击加载更多

Functional JavaScript 之 Transducer

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

Scalaz（48）－ scalaz-stream: 深入了解-Transducer: Process1-tee-wye

翻译连载 | 附录 A：Transducing（下）－《JavaScript轻量级函数式编程》 |《你不知道的JS》姊妹篇

Human Language Processing——RNA&RNN-T&MochA

医疗相关 EDF 文件查看及读取

【JS】446- 你不知道的 map

Reduce 和 Transduce 的含义

语音识别的前沿论文，看我们推荐的这4篇

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

PyTorch+Kaldi、专注E2E语音识别，腾讯AI Lab开源轻量级语音处理工具包PIKA

JavaScript 设计模式学习第十七篇－桥接模式

Scalaz（55）－ scalaz-stream: fs2-基础介绍，fs2 stream transformation

【NLP】自然语言处理学习笔记（一）语音识别

语音识别技术在英语学习中的创新应用

融合语音识别与语言理解的技术探索

语音识别的一些开源项目整理

Attention-lvcsr、Residual LSTM…你都掌握了吗？一文总结语音识别必备经典模型（三）

Scalaz（46）－ scalaz-stream 基础介绍

Scalaz（53）－ scalaz-stream: 程序运算器－application scenario

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐