中国首个 Sora 级模型 Vidu 发布：可生成最长 16 秒、最高 1080P 视频- DoNews

DoNews > 公司新闻 > 中国首个 Sora 级模型 Vidu 发布：可生成最长 16 秒、最高 1080P 视频

中国首个 Sora 级模型 Vidu 发布：可生成最长 16 秒、最高 1080P 视频

IT之家 2024-04-27 13:17:17

生数科技今天出席中关村论坛未来人工智能先锋论坛，携手清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型 ——Vidu，被媒体和业内人士认为是国内首个 Sora 级别的视频大模型。

根据官方描述，Vidu 模型融合 Diffusion 与 Transformer，开创性创建了 U-ViT，支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

官方宣传资料中演示了“画室中的一艘船驶向镜头”、其海浪、船的效果非常逼真。

官方表示 Vidu 不仅能够模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点。

Vidu 是自 Sora 发布之后，全球率先取得重大突破的视频大模型，性能全面对标国际顶尖水平，并在加速迭代提升中。

Vidu 的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。

其核心技术 U-ViT 架构由团队于 2022 年 9 月提出，早于 Sora 采用的 DiT 架构，是全球首个 Diffusion 与 Transformer 融合的架构。

2023 年 3 月，团队开源了全球首个基于 U-ViT 融合架构的多模态扩散模型 UniDiffuser，率先完成了 U-ViT 架构的大规模可扩展性验证。

IT之家附上参考地址

中国首个长时长、高一致性、高动态性视频大模型，Vidu 登场！

本文转载自IT之家，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请联系IT之家通知我方删除，我方将在收到通知后第一时间删除内容！本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

嘉楠科技第二季营收1亿美元：净亏1106万美元嘉楠科技2025年Q2营收1亿美元，同比增长39.5%；毛利930.6万美元，实现扭亏为盈。

银诺医药港股上市：大涨206%，市值262亿港元银诺医药港股上市，募资6.83亿港元，核心产品即将商业化，2025年前5月亏损9788万元。

文远知行获Grab投资数千万美元文远知行获Grab数千万美元投资，加速东南亚L4级Robotaxi部署，推动AI出行与司机转型。

新一代智己LS6预售权益价20.99万起，开创智能出行新品类颠覆20万级大五座SUV格局

东方财富上半年净利润为55.67亿元同比增长37.27% 东方财富2025年上半年营收68.57亿元，净利55.67亿元，证券业务稳健发展，布局做市业务。

富士康母公司二季度净利大增27%，但全年营收增速或低于预期鸿海2025上半年业绩亮眼，AI服务器需求激增推动营收3.44万亿新台币，Q2净利润同比大增27%。

大华股份上半年归母净利润24.8亿元同比增长36.8% 大华股份2025年上半年营收151.8亿元，净利24.8亿元，技术升级与国际化运营成风险应对关键。

芯朋微上半年净利润同比增长106.02% 芯朋微2025年上半年营收6.36亿元，净利9049万元，同比增长40.32%和106.02%。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号