2026年7月3日,北京生数科技正式发布新一代实时交互视频模型Vidu S1。该模型支持语音控制数字人行为、实时视频通话及无限时长连续互动,输出分辨率达540P、帧率最高42FPS。基于自回归扩散架构(AR+Diffusion),Vidu S1可依据历史画面、语音指令与对话上下文动态生成后续内容,实现表情、动作与视频走向的实时响应。模型现已开启内测,提供线上体验与API接入服务。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
2026年7月3日,北京生数科技正式发布新一代实时交互视频模型Vidu S1。该模型支持语音控制数字人行为、实时视频通话及无限时长连续互动,输出分辨率达540P、帧率最高42FPS。基于自回归扩散架构(AR+Diffusion),Vidu S1可依据历史画面、语音指令与对话上下文动态生成后续内容,实现表情、动作与视频走向的实时响应。模型现已开启内测,提供线上体验与API接入服务。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。