2026年3月5日,OpenAI正开发新型双向语音模型BiDi,旨在实现更自然的实时语音交互。该模型可动态响应用户中途打断(如插话“okay”),即时调整回应,突破当前回合式语音模式的限制。目前原型仍存稳定性问题,原计划Q1发布已推迟至Q2或更晚。BiDi有望率先应用于客服场景及未来语音优先AI硬件,推动语音交互向文本级性能迈进。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
2026年3月5日,OpenAI正开发新型双向语音模型BiDi,旨在实现更自然的实时语音交互。该模型可动态响应用户中途打断(如插话“okay”),即时调整回应,突破当前回合式语音模式的限制。目前原型仍存稳定性问题,原计划Q1发布已推迟至Q2或更晚。BiDi有望率先应用于客服场景及未来语音优先AI硬件,推动语音交互向文本级性能迈进。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。