MiniMax公司发布的Hailuo 02视频大模型已正式上线。该模型采用NCR(Noise-aware Compute Redistribution)新架构,训练与推理效率提升2.5倍,总参数量较Hailuo 01扩大3倍,训练数据量扩大4倍,增强对复杂指令及物理场景的理解能力。
在Artificial Analysis Video Arena的Image-to-Video榜单中,Hailuo 02位列全球第二,仅次于字节跳动的Seedance 1.0,领先Google Veo 3与可灵2.0。
实测显示,Hailuo 02在复杂物理场景理解方面表现突出:输入‘雨夜,四十多岁的男人站在高楼楼顶,风衣下摆被风吹动,雨水顺着下巴滴落’等提示词,模型能准确生成风衣摆动、面部雨水滑落等符合现实物理规律的画面;输入‘一位年轻女子半身像,电影画面投射在她身上’,亦能还原光影投影效果。
在复杂指令遵循测试中,模型可实现多层级镜头调度,如从广场人群迅速下降至钟楼狙击点并完成瞄准镜十字线特写,或从电视屏幕通缉令与真人面容重叠画面,无缝转场至男子脱帽冷笑、消失于贫民窟人群的全景镜头。
图生视频任务中,模型保持人物形象与原始画风高度一致,生成内容稳定,例如‘唐僧行走于天宫之中,从玉皇大帝和诸神中走向镜头’及‘泳池里的labubu游到岸边,换上泳衣,躺在沙滩椅上喝饮料’等提示均获准确响应。
Hailuo 02支持1080P分辨率输出,单次生成时长可达10秒,已开放API服务。MiniMax规划路线图包含4K生成、分层编辑与长视频一致性优化等后续能力。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



