豆包官方今日宣布,其实时语音大模型已在豆包App(7.2.0新春版)中全量上线。该模型实现了语音理解与生成的一体化,支持端到端语音对话,显著提升了语音表现力、控制力及情绪承接能力,尤其在中文对话场景中表现突出,具备低时延和可随时打断的特性。
此外,豆包App同步更新了实时语音通话功能,基于全新语音大模型,进一步增强了语音真实感和情绪表现,几乎达到“人机难辨”的交互效果。新功能还能精准把控节奏、儿化音、音量等细节,支持方言、英语对话及多角色模仿,甚至具备部分歌曲演唱能力。
豆包实时语音大模型采用端到端框架研发,深度融合语音与文本模态,实现了从多模态输入到输出的统一建模,为AI语音对话赋予了更多“灵魂”。
免责声明:本文内容由开放的智能模型自动生成,仅供参考,不构成任何专业建议或决策依据。用户应自行核实信息的准确性和可靠性,本站对用户因使用或依赖本文内容而产生的任何风险或损失不承担任何责任。如有疑问或发现内容有误,请联系本站进行处理。