英伟达发布专为物理AI打造的开放世界基础模型NVIDIA Cosmos™ 3。该模型基于突破性的“混合Transformer”架构,整合视觉推理、世界生成与动作预测于单一系统。
Cosmos 3是全球首个完全开放的“全能模型”(omnimodel),能够以领先的物理精度原生理解并生成文本、图像、视频、环境音效及动作,将物理AI的训练与评估周期从数月缩短至数日。
英伟达同步推出“NVIDIA Cosmos 联盟”,汇聚Agile Robots、Black Forest Labs、Generalist、LTX、Runway和Skild AI等世界模型构建者与AI开发者,共同推动下一代世界模型发展。
英伟达创始人兼首席执行官黄仁勋表示,多模态推理、语言、视觉及世界模型领域的突破性进展,使物理AI的“大爆炸”时刻临近;Cosmos 3系列开放式前沿全能模型将赋能开发者构建可在物理世界中感知、推理、规划与行动的机器人、自动驾驶车辆及视觉AI系统。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



