可灵2.0大师版正式发布,视频及图像可控生成与编辑能力再升级

4月15日,可灵AI在北京中关村国际创新中心举行“灵感成真”2.0模型发布会,宣布基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

自去年 6 月发布以来,可灵 AI 便在 AI 赛道上一路狂奔,展现出强大的发展潜力。数据显示,其已累计完成超 20 次迭代,凭借不断优化的性能和丰富的功能,吸引了来自全球各地的用户。截至目前,可灵 AI 全球用户规模已突破 2200 万,月活用户数量在短短 10 个月内增长 25 倍,这一成绩在竞争激烈的 AI 市场中堪称亮眼。同时,超 1.5 万开发者和数千家国内外企业客户,如小米、亚马逊云科技、阿里云、Freepik、蓝色光标等,将可灵的 API 广泛应用于不同行业场景,累计生成约 1200 万个图像和超过 4000 万个视频素材,可灵 AI 正逐渐成为 AI 时代视频创作的新基础设施。

快手高级副总裁、社区科学线负责人盖坤在发布会上表示,可灵 AI 一直致力于提升模型基础质量,增强画质清晰度,并引入更多创新功能,以满足用户多样化需求。可灵 AI 的愿景是让每个人都能用 AI 讲出好故事,实现更加精准的复杂创意表达。然而,盖坤也指出,当前 AI 行业在生成内容的稳定性以及用户复杂创意的精确传达方面仍面临诸多挑战,要实现 “用 AI 讲好每一个故事” 的目标,必须全方位提升基模型能力,定义人和 AI 交互的 “全新语言”。

在这样的背景下,可灵 AI 在 2.0 模型的迭代中,正式发布了 AI 视频生成的全新交互理念 Multi-modal Visual Language(MVL)。MVL 由 TXT(Pure Text,语义骨架)和 MMW(Multi-modal-document as a Word,多模态描述子)组成,它打破了传统文字表达在影像信息传达上的局限,使用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给 AI。基于 MVL 理念,可灵 AI 推出了多模态编辑功能,用户不仅可以用图像作为输入生成创意视频,未来 MMW 还将引入声音、运动轨迹等更多模态信息,为用户提供更加丰富的表达途径。
 
发布会上,快手副总裁、可灵 AI 负责人张迪发布了全新的可灵 2.0 大师版。这一版本在语义响应、动态质量、画面美学等方面实现了显著提升,是一次技术、体验、美学的三重突破。可灵 2.0 大师版全面升级了视频及图像创作可控生成与编辑能力,上线的全新多模态视频编辑功能,能够灵活理解用户意图。创作者可以在一段视频的基础上,通过输入图片或文字,对生成的视频内容进行元素的增加、删减、替换,极大地提高了二次编辑和处理的灵活性。
 
在图像生成大模型领域,可图 2.0 同样表现出色,处于行业领先水平。它具备强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等多项核心优势。在团队内部的多项胜负率评测中,相较于 Midjourney V7、FLUX1.1 [pro] 以及 Reve 等行业领先的图像模型,可图 2.0 均保持明显优势。可图 2.0 的文生图能力迎来全面升级,大幅提升了指令遵循能力,显著增强了电影美学表现力,还拥有更多元的艺术风格,可支持 60 多种风格化的效果转绘,让模型出图的创意和想象力实现大幅跃升。此外,可图 2.0 还上线了局部重绘和扩图等实用的图像可控编辑功能,以及全新的风格转绘功能,用户只需上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时精准保留原图的语义内容。
 
可灵 AI 2.0 的发布,不仅为个人创作者带来了更强大的创作工具,也为众多行业带来了新的发展机遇。AIGC 技术的迅猛发展,正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。
 
以二次元 AI 创作社区产品狸谱为例,可灵 AI 为其带来了创新突破。狸谱 1.6 版本在人物运动流畅度、镜头移动等方面展现出卓越性能,助力狸谱成功接入 “动态 LIVE” 和 “新春萌偶摇” 两大功能。其中,“动态 LIVE” 实现了 “图 - 影 - 音” 快速创作,“新春萌偶摇” 在春节期间引发 60 万用户转播。未来,双方将基于狸谱的优质内容数据与可灵的算法能力,打造动画模型,推动 AI 成为内容引擎,并共同孵化优质创作者,构建更活跃的创作生态,携手开启二次元内容产业的新篇章。
 
可灵 AI 超级创作者、《新世界加载中》总导演、异类 Outliers 创始人陈翔宇在分享中表示,“可灵 AI 可全面融入剧集级创作流程”。AIGC 相较于实拍和动画,不仅提升了创作效率,更是革命性地释放了试错空间。异类 Outliers 团队从剧本创作到内容发行,完成了一次完整的影像工业化创作流程,实践证明可灵 AI 是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。在 AI 的辅助下,导演及编剧团队的大量内容创意实现了更富有想象力的表达,陈翔宇认为 “AIGC 也许是下一代内容结构的雏形”。
 
为了进一步激发 AI 爱好者们的创作热情,快手副总裁、可灵 AI 负责人张迪在发布会现场正式发起 “可灵 AI NextGen 新影像创投计划”。该计划将投入千万资金,为 AIGC 创作者提供全球宣发、IP 打造和保障等支持,以全资出品、联合出品和技术支持等灵活多样的合作方式,助力 AI 好故事走向世界。同时,可灵 AI 面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创 AI 创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。
 
此次可灵 AI 2.0 的发布,在技术创新、功能升级以及行业应用等方面都取得了重大突破,为全球创作者提供了更强大的创作平台,也为 AIGC 技术在各行业的深入应用奠定了坚实基础。正如盖坤所说,可灵 AI 将持续大力推动技术创新,用人与 AI 交互的全新语言,帮助用户实现复杂创意的精确表达。未来,可灵 AI 有望在 AI 创作领域继续深耕,引领行业发展潮流,让 “每个人都能用 AI 讲出好故事” 的愿景早日成为现实,为全球内容创作产业带来更多惊喜和变革。
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1