谷歌 DeepMind 推出 CAT4D AI 系统，将普通视频转化为动态 3D 场景- DoNews

DoNews > 公司新闻 > 谷歌 DeepMind 推出 CAT4D AI 系统，将普通视频转化为动态 3D 场景

谷歌 DeepMind 推出 CAT4D AI 系统，将普通视频转化为动态 3D 场景

2025-01-04 14:04:09

科技媒体 The Decoder 报道称，谷歌 DeepMind 联合哥伦比亚大学和加州大学圣地亚哥分校的研究人员开发了一款名为 CAT4D 的 AI 系统。该系统能够将普通视频转化为动态 3D 场景，大大降低了 3D 内容创作的门槛，为多个行业带来了新的可能性。

CAT4D 系统利用扩散模型，将单视角拍摄的视频转换为多视角视图，并构建为动态 3D 场景，用户可以从不同角度观看视频中的主体，仿佛置身其中。以往实现类似效果需要多台摄像机同时录制同一场景，而 CAT4D 则简化了这一流程，只需普通视频素材即可。这项技术有望革新游戏开发、电影制作和增强现实等领域。

在训练过程中，DeepMind 团队发现缺乏足够的现有数据，因此他们混合了真实世界的镜头与计算机生成的内容进行训练。训练数据包括静态场景的多视图图像、单视角视频和合成 4D 数据，通过扩散模型学习，在特定时刻从特定角度创建图像。

目前，CAT4D 所生成的 3D 场景虽然比原始素材短，但成像质量已优于同类系统。该技术具有广泛的应用前景，游戏开发者可以利用它创建虚拟环境，电影制作人和 AR 开发者也可以将其融入到工作流程中。

优惠后7.89万起，“全球智能SUV”第四代CS55PLUS正式发布第四代CS55PLUS正式发布！

雷军2025年度演讲：小米这五年的改变雷军发布小米17系列新品，回顾五年技术蜕变，分享造车、造芯历程，展现小米高端化与全生态战略布局。

以自然美学重构汽车设计，欧拉5与当代城市有机共生欧拉5与当代城市有机共生

博世计划大规模裁员：规模或达数万人博世拟大幅裁员数万人以节省25亿欧元，因汽车业务利润率未达目标，市场环境疲软致营收增长乏力。

销量腰斩、转型迟滞，至境L7能成别克救星？至境L7能否扭转销量颓势？

“智”造传统！比亚迪天神之眼体验！ “智”造传统！比亚迪天神之眼体验！

千万粉丝网红「蓝战非」被禁止关注，此前自爆九位数年收入千万粉丝网红蓝战非因自曝年收入可达九位数被禁止关注，其为前职业电竞选手，现游戏主播、旅游博主。

追觅回应强制员工跟投：消息不实追觅旗下追创创投澄清“强制员工跟投”为不实信息，强调跟投遵循自愿原则，已启动法律程序维护权益。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号