谷歌发布Gemini 3.5 Live Translate实时语音互译模型

6月9日晚,谷歌正式推出实时语音互译音频模型Gemini 3.5 Live Translate。该模型支持70多种语言识别与自然语音翻译,可实时保留原说话者语调、语速和音高。相比传统轮流翻译系统,其采用流式处理,在延迟仅数秒前提下实现连续、流畅输出。即日起,开发者可通过Gemini Live API及Google AI Studio试用公开预览版;企业用户本月起可在Google Meet中体验私有预览版;普通用户将通过Android与iOS版谷歌翻译应用上线使用,Android端还将新增“聆听模式”,支持贴耳收听翻译音频。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号