英伟达开源Parakeet TDT 0.6B语音识别模型，速度提升50倍- DoNews快讯

DoNews > 快讯 > 英伟达开源Parakeet TDT 0.6B语音识别模型，速度提升50倍

英伟达开源Parakeet TDT 0.6B语音识别模型，速度提升50倍

2025-05-07 13:58:02

411257

科技媒体marktechpost报道，英伟达近日推出开源自动语音识别（ASR）模型Parakeet TDT 0.6B，在Hugging Face平台公开。该模型以速度和精度见长，仅需1秒即可处理60分钟音频，速度达主流开源ASR模型的50倍，字错率（WER）低至6.05%，位居开源ASR领域前列。

Parakeet TDT 0.6B基于Transformer架构，针对英伟达硬件优化，支持实时转录、语音分析等企业级应用。其6亿参数的编码-解码结构结合量化和融合内核，显著提升推理效率，并具备时间戳、数字格式化及标点恢复功能。此外，该模型创新支持歌曲转歌词转录，适用于音乐索引和媒体平台，实时率（RTF）高达3386。

这一模型的推出，为会议记录、法律转录、医疗记录等场景提供了高效解决方案，同时降低了后期处理成本，展现出强大的商业应用潜力。

沪上阿姨登陆港交所：开盘上涨超68%，市值184.31亿港元每股175.80港元。

限制SU7 Ultra马力，小米汽车连夜道歉考虑不周全。

2025 款阿维塔 12 上市；吉利拟建议私有化极氪；理想汽车回应网传李想年薪 6.39 亿｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

消息称美国环境保护局拟结束“能源之星”节能认证已启用30余年。

李彦宏内部讲话：坚持相信，我们可以改变世界 Create2025。

阿维塔12 2025款焕新升舱，26.99万元起售新增岱红内饰配色。

Counterpoint：Q1全球智能手机市场收入同比增3%，苹果vivo保持增长华为和Moto两位数同比增长。

上市不足三年，帕瓦股份假账连篇被实施风险警示胆大包天。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号