腾讯发布混元图像2.0模型 实现毫秒级实时生图

5月16日,腾讯发布混元图像2.0模型(Hunyuan Image2.0),基于架构创新实现实时生图功能,生成速度达到毫秒级响应,显著优于行业水平。

相比前代,新模型参数量提升一个数量级,借助高压缩倍率编解码器与扩散架构,其推理速度远快于同类产品。在每张图需5到10秒生成的情况下,混元图像2.0可支持用户边输入边生成,改变传统交互模式。

该模型生成质量大幅提升,通过强化学习及美学知识对齐,生成图片真实感强、细节丰富,避免了“AI味”。在GenEval评估基准上,其准确率超过95%,领先其他模型。

官方演示显示,模型在人物特写、动物特写、复古摄影等领域表现出电影级质感画面水准,涵盖多种风格如人像摄影、动漫风格和真实人物风格。

此外,混元图像2.0推出实时绘画板功能,用户绘制线稿或调整参数时可同步预览上色效果,突破传统创作流程。实时绘画板还支持多图融合,经AI自动协调透视与光影生成融合图像。

发布会上,腾讯透露即将发布原生多模态图像生成大模型,在多轮生成与交互体验方面表现突出。自2014年起,腾讯混元持续投入多模态技术,开源首个中文DiT架构文生图模型及130亿参数的视频生成大模型,此次发布是其又一里程碑事件。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1