OpenAI发布三款实时语音模型,支持推理、翻译与转录

2026年5月8日,OpenAI正式发布GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper三款实时语音模型,集成于Realtime API。其中,GPT-Realtime-2具备GPT-5级推理能力,支持打断处理与工具调用;Translate支持70种语言输入转13种输出,同步翻译;Whisper实现低延迟流式转录。三者分别按Token或分钟计费,旨在解决语音交互中的延迟、多语言支持及实时性难题。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号