力压 DALL-E 3 等顶级模型,谷歌开放 Imagen 3 文生图 AI 访问

科技媒体 VentureBeat 报道,谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3,用户可以打开 AI Test Kitchen 体验该功能,官方称最新版本“节更清晰、光照更丰富、干扰性人工痕迹更少”。

谷歌于今年 5 月召开的 I / O 开发者大会上宣布 Imagen 3 模型,6 月邀请部分 Vertex AI 用户测试使用,而现在正式向美国用户开放。

谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,Imagen 3 能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。

在谷歌的人工和自动评估中,Imagen 3 的表现优于 Imagen 2、DALL-E 3、Midjourney v6、Stable Diffusion 3 和 Stable Diffusion XL 1.0,Imagen 3 在将文本描述与生成的图像相匹配以及处理详细提示方面表现尤为突出。

IT之家附上网友分享的对比图如下:

以上图源:Dogan Ural

本文转载自IT之家,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系IT之家通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1