字节跳动发布Seed LiveInterpret 2.0同传模型 延迟与准确率接近人类水平

字节跳动Seed团队今日正式推出端到端同声传译模型Seed LiveInterpret 2.0,这是首款延迟与准确率均接近人类水平的中英语音同传系统。该模型基于全双工语音生成框架,支持实时中英互译,可同时处理多人语音输入,并以极低延迟实现“边听边说”。

测试显示,面对40秒的中文长句,系统能流畅输出音色一致的英文翻译,延迟仅2-3秒,较传统系统降低超60%。其翻译准确率在多人会议场景中达70%以上,单人演讲超80%,接近专业同传水准。此外,模型支持零样本声音复刻,可实时还原说话人音色,提升交流自然度。

目前,该技术已通过火山引擎对外开放,Ola Friend耳机将于8月底首发接入,成为首款支持该模型的智能硬件设备。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1