智谱开源文生图模型 CogView3-Plus，相关功能上线智谱清言 App- DoNews

DoNews > 公司新闻 > 智谱开源文生图模型 CogView3-Plus，相关功能上线智谱清言 App

智谱开源文生图模型 CogView3-Plus，相关功能上线智谱清言 App

IT之家 2024-10-14 11:13:47

智谱技术团队今天宣布开源文生图模型 CogView3 及 CogView3-Plus-3B ，该系列模型的能力已经上线“智谱清言”App。

据介绍，CogView3 是一个基于级联扩散的 text2img 模型，其包含如下三个阶段：

第一阶段：利用标准扩散过程生成 512x512 低分辨率的图像。
第二阶段：利用中继扩散过程，执行 2 倍的超分辨率生成，从 512x512 输入生成 1024x1024 的图像。
第三阶段：将生成结果再次基于中继扩散迭代，生成 2048×2048 高分辨率的图像。

官方表示，在实际效果上，CogView3 在人工评估中比目前最先进的开源文本到图像扩散模型 SDXL 高出 77.0%，同时只需要 SDXL 大约 1/10 的推理时间。

CogView3-Plus 模型则在 CogView3（ECCV'24）的基础上引入了最新的 DiT 框架，以实现整体性能的进一步提升。据介绍，其采用 Zero-SNR 扩散噪声调度，并引入了文本-图像联合注意力机制。与常用的 MMDiT 结构相比，它在保持模型基本能力的同时，有效降低训练和推理成本。CogView-3Plus 使用潜在维度为 16 的 VAE。

IT之家附地址如下：

开源仓库地址：

https://github.com/THUDM/CogView3

Plus 开源模型仓库：

https://huggingface.co/THUDM/CogView3-Plus-3B
https://modelscope.cn/models/ZhipuAI/CogView3-Plus-3B

本文转载自IT之家，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请联系IT之家通知我方删除，我方将在收到通知后第一时间删除内容！本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

华为两款鸿蒙电脑今起开售，最低 7999 元起华为发布两款鸿蒙电脑，MateBook Pro售价7999元起，MateBook Fold非凡大师23999元起，搭载HarmonyOS 5系统，推动国产操作系统发展。

传宇树科技已完成股改，最新估值100亿元以上宇树科技完成股改，或筹备上市，估值超100亿。公司主营四足机器狗和人形机器人，获30余家机构投资，科研市场占比60%。

虚拟稳定币Circle登陆纽交所首日收涨近170% Circle成功在纽交所上市，首日涨幅168.5%，市值超180亿美元，USDC稳定币占全球市场29%。

中芯国际宣布将宁波工厂卖给湖南国科微中芯国际子公司拟向国科微出售中芯宁波14.832%股权，交易完成后国科微将持股94.366%，聚焦射频前端等特种工艺半导体制造。

王自如离开格力后首发声，感谢董明珠雷军给自己鼓励和帮助王自如发布16分钟视频，回应离职ZEALER与格力原因，宣布进军AI二次创业，感谢董明珠与雷军支持。

因拖欠游戏分成，中清龙图被塔人网络起诉塔人网络因中清龙图拖欠《奇迹：最强者》分成款2003万元，向法院提起诉讼，要求支付款项及违约金，案件已受理。

看好谷子经济，拼多多旗下快团团内测新业务拼多多快团团推出拼谷团购业务，专注谷圈市场，提供发布拼谷、批量调价等功能，内测阶段需邀请码进入。

艾体验AIUX：三年前的研究成果被吉利研究院直接不署名引用设计公司艾体验AIUX指控吉利汽车在行业大会分享中抄袭其三年前的原创研究成果，要求公开致歉及澄清。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号