声网与 MiniMax 深化全球战略合作- DoNews

DoNews1月20日消息，近期，MiniMax 在港交所成功上市，其与声网也进一步深化了战略合作关系。MiniMax 将领先的文本转语音（TTS）技术及多模态大模型，与声网对话式 AI 引擎以及全球超低延时实时传输网络（SD-RTN）相结合。这一强强联手将助力全球开发者与企业，部署更具生命力、响应更灵敏、体验更拟人化的对话式 AI 产品。

早在2024年10月，声网就宣布与 MiniMax 联手发布国内首个 Realtime API，助力 AI 告别“机械感”，实现更低延时的自然交流。

从模型能力走向真实世界的交互

随着生成式 AI 的飞速发展，行业真正的挑战在于如何将高质量的 AI 转化为跨设备、跨复杂网络环境的自然实时交互体验。

MiniMax 的 TTS 模型具备表达丰富、可控且情感细腻的语音生成能力，支持多种语言、语调和说话风格。而声网则提供了互补的核心优势：将 AI 输出转化为实时交互体验，这使得 AI 的表现更贴近人类的沟通模式。

此次合作的独特之处不仅在于技术层面的集成，更在于双方全球化的视野：

MiniMax 带来具备全球视野的前沿 AI 模型：其模型在设计之初就针对多语言、多文化及内容丰富的应用场景进行了优化。

声网提供经受过实战检验的全球实时网络：其自建的 SD-RTN™ 网络覆盖 200 多个国家和地区，旨在提供毫秒级的超低延时、优秀的抖动控制以及大规模并发下的音视频质量保证。

双方共同填补了 AI 生态系统中的关键空白：即无论用户身处何地、使用何种设备，都能获得稳定、自然且富有表现力的 AI 语音交互体验。

赋能下一代实时语音 AI 产品

声网与 MiniMax 的联合解决方案已在多个场景中落地，包括：

· AI 陪伴与智能设备：需要实时语音反馈的交互场景

· 实时语音 Agents：用于客服和企业工作流的自动化交互

· 互动教育与内容平台：对自然语音质量和全球覆盖能力有极高要求的应用

· 多模态 AI 应用：语音需与视觉、情感及动作保持高度同步的复杂场景

声网与 MiniMax 为开发者提供了一个从文本生成到实时语音交付的完整、端到端对话式 AI 基础底座。随着 AI 从云端走向日常交互的每一个瞬间，双方将持续为开发者和企业提供强有力的支持。