智谱 AI 开源 CogVideoX 视频生成模型:“清影”同源,单张 4090 显卡可推理

智谱 AI 今日宣布,将与“清影”同源的视频生成模型 ——CogVideoX 开源。

据介绍,CogVideoX 开源模型包含多个不同尺寸大小的模型,目前将开源 CogVideoX-2B,它在 FP-16 精度下的推理需 18GB 显存,微调则需要 40GB 显存,这意味着单张 4090 显卡即可进行推理,而单张 A6000 显卡即可完成微调

CogVideoX-2B 的提示词上限为 226 个 token,视频长度为 6 秒,帧率为 8 帧 / 秒,视频分辨率为 720*480。

官方表示,性能更强参数量更大的模型正在路上,敬请关注与期待。

IT之家附相关链接:

  • 代码仓库:https://github.com/THUDM/CogVideo

  • 模型下载:https://huggingface.co/THUDM/CogVideoX-2b

  • 技术报告:https://github.com/THUDM/CogVideo/blob/main/resources/CogVideoX.pdf

本文转载自IT之家,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系IT之家通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1