阿里通义实验室推出OmniAudio技术可从360°视频生成空间音频- DoNews

DoNews > 公司新闻 > 阿里通义实验室推出OmniAudio技术可从360°视频生成空间音频

阿里通义实验室推出OmniAudio技术可从360°视频生成空间音频

推荐 2025-06-03 21:12:03

阿里通义大模型语音团队推出「空间音频生成」模型——OmniAudio，该模型能够直接从360°视频生成FOA（First-order Ambisonics）空间音频。

为实现这一目标，团队定义了360V2SA任务（360-degree Video to Spatial Audio），旨在解决如何利用全景视频生成匹配的空间音频问题。

由于配对的360°视频和空间音频数据稀缺，通义实验室构建了Sphere360数据集。这一数据集包含超过10.3万个真实世界视频片段，涵盖288种音频事件，总时长288小时，均为高质量的360°视频及相应FOA空间音频。

目前，OmniAudio已开源，包括代码、数据仓库及相关技术论文均已上架GitHub。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

华为两款鸿蒙电脑今起开售，最低 7999 元起华为发布两款鸿蒙电脑，MateBook Pro售价7999元起，MateBook Fold非凡大师23999元起，搭载HarmonyOS 5系统，推动国产操作系统发展。

传宇树科技已完成股改，最新估值100亿元以上宇树科技完成股改，或筹备上市，估值超100亿。公司主营四足机器狗和人形机器人，获30余家机构投资，科研市场占比60%。

虚拟稳定币Circle登陆纽交所首日收涨近170% Circle成功在纽交所上市，首日涨幅168.5%，市值超180亿美元，USDC稳定币占全球市场29%。

中芯国际宣布将宁波工厂卖给湖南国科微中芯国际子公司拟向国科微出售中芯宁波14.832%股权，交易完成后国科微将持股94.366%，聚焦射频前端等特种工艺半导体制造。

王自如离开格力后首发声，感谢董明珠雷军给自己鼓励和帮助王自如发布16分钟视频，回应离职ZEALER与格力原因，宣布进军AI二次创业，感谢董明珠与雷军支持。

因拖欠游戏分成，中清龙图被塔人网络起诉塔人网络因中清龙图拖欠《奇迹：最强者》分成款2003万元，向法院提起诉讼，要求支付款项及违约金，案件已受理。

看好谷子经济，拼多多旗下快团团内测新业务拼多多快团团推出拼谷团购业务，专注谷圈市场，提供发布拼谷、批量调价等功能，内测阶段需邀请码进入。

艾体验AIUX：三年前的研究成果被吉利研究院直接不署名引用设计公司艾体验AIUX指控吉利汽车在行业大会分享中抄袭其三年前的原创研究成果，要求公开致歉及澄清。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号