DoNews1月20日消息,近期,MiniMax 在港交所成功上市,其与声网也进一步深化了战略合作关系。MiniMax 将领先的文本转语音(TTS)技术及多模态大模型,与声网对话式 AI 引擎以及全球超低延时实时传输网络(SD-RTN)相结合。这一强强联手将助力全球开发者与企业,部署更具生命力、响应更灵敏、体验更拟人化的对话式 AI 产品。

早在2024年10月,声网就宣布与 MiniMax 联手发布国内首个 Realtime API,助力 AI 告别“机械感”,实现更低延时的自然交流。
从模型能力走向真实世界的交互
随着生成式 AI 的飞速发展,行业真正的挑战在于如何将高质量的 AI 转化为跨设备、跨复杂网络环境的自然实时交互体验。

MiniMax 的 TTS 模型具备表达丰富、可控且情感细腻的语音生成能力,支持多种语言、语调和说话风格。而声网则提供了互补的核心优势:将 AI 输出转化为实时交互体验,这使得 AI 的表现更贴近人类的沟通模式。
此次合作的独特之处不仅在于技术层面的集成,更在于双方全球化的视野:
MiniMax 带来具备全球视野的前沿 AI 模型:其模型在设计之初就针对多语言、多文化及内容丰富的应用场景进行了优化。
声网提供经受过实战检验的全球实时网络:其自建的 SD-RTN™ 网络覆盖 200 多个国家和地区,旨在提供毫秒级的超低延时、优秀的抖动控制以及大规模并发下的音视频质量保证。
双方共同填补了 AI 生态系统中的关键空白:即无论用户身处何地、使用何种设备,都能获得稳定、自然且富有表现力的 AI 语音交互体验 。
赋能下一代实时语音 AI 产品
声网与 MiniMax 的联合解决方案已在多个场景中落地,包括:
· AI 陪伴与智能设备:需要实时语音反馈的交互场景
· 实时语音 Agents:用于客服和企业工作流的自动化交互
· 互动教育与内容平台:对自然语音质量和全球覆盖能力有极高要求的应用
· 多模态 AI 应用:语音需与视觉、情感及动作保持高度同步的复杂场景
声网与 MiniMax 为开发者提供了一个从文本生成到实时语音交付的完整、端到端对话式 AI 基础底座。随着 AI 从云端走向日常交互的每一个瞬间,双方将持续为开发者和企业提供强有力的支持。
未来,双方计划在实时语音智能体、AI 原生设备以及多模态对话体验等领域进一步扩大合作。



