FFmpeg新增AI音频转写工具af_whisper，支持实时流与多格式输出- DoNews快讯

DoNews > 快讯 > FFmpeg新增AI音频转写工具af_whisper，支持实时流与多格式输出

FFmpeg新增AI音频转写工具af_whisper，支持实时流与多格式输出

2025-08-13 23:03:02

418988

开源媒体框架FFmpeg近日集成全新af_whisper音频工具，通过内置的自动语音识别（ASR）功能，用户可直接在FFmpeg生态中实现高效音频转文本。该工具基于whisper.cpp库，支持选择AI模型、指定语言及输出格式（文本、SRT或JSON），并可处理预录文件与实时音频流，结合语音激活检测（VAD）提升准确率。

此外，GPU加速功能的加入大幅缩短转写时间，将复杂的外部流程简化为单一命令行操作，为媒体处理提供更高效的解决方案。

李佳琦直播间首次带货奔驰，40台车秒售罄李佳琦直播间首次售奔驰整车，40台秒罄；采用线上付定金、线下提车模式，购车后传发票可领5000元红包。

消息称阿里考虑让钉钉CEO离职，最快今天官宣阿里合伙人委员会考虑让钉钉CEO陈航离职、降职或退居幕后，最快今日公布，官方尚未回应。

豆包专业版开放灰度测试；联想全品类 7 月再涨价；余承东官宣智界 RX新车｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

甲骨文 2026 财年年报归母净利润 169.84 亿美元，同比增长 36.5% 甲骨文2026财年营收673.57亿美元（+17.35%），云业务达340亿（+39%），AI驱动IaaS与数据库爆发式增长，RPO达6380亿，2027财年营收指引900亿美元。

豆包专业版开启灰度测试，高级版年费5088元豆包AI启动专业版付费灰度测试，6月下旬正式上线，分标准、加强、高级三档订阅，价格68–500元/月，权益逐级提升。

消息称李微萌卸任智己汽车CMO，继任者来自上汽系智己汽车CMO李微萌卸任，或转岗AI业务；其曾主导品牌营销与用户运营，出身蔚来、安吉星，2020年加入智己。

云知声登上LLM Stats 排行榜云知声U2登LLM Stats综合榜前30、厂商第九；LongBench-V2长上下文评测以54.4%准确率超Claude Opus 4.7。

5个真实场景实测：云知声U2，可能是最能“干活”的大模型云知声发布U2大模型，主打高智能密度与高Token价值，实测在编程、办公、金融分析等任务中表现优异，强调原生Agent能力与性价比。

关于我们| 电子协议| 合作联系| 京ICP备2025120072号

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号

京公网安备11010802023059号