MIT团队提出新型图像生成方法:无需生成器即可编辑修复

人工智能图像生成技术预计将成为数十亿美元产业,目前可实现如朋友在火星插旗等画面生成,耗时不到一秒。

现有图像生成技术通常需要基于包含数百万图像的海量数据集进行训练,可能耗时数周甚至数月,并消耗大量计算资源。

2025年夏初,在加拿大温哥华举行的国际机器学习大会(ICML 2025)上,麻省理工学院(MIT)团队展示了一种重新构想的图像生成方法,使标记器和解码器无需生成器即可实现图像编辑和修复。

相关研究成果已发表在arXiv预印本服务器上,研究团队成员包括MIT信息与决策系统实验室研究生研究员Lukas Lao Beyer、MIT计算机科学与人工智能实验室博士后研究员Tianhong Li、Facebook人工智能研究中心Xinlei Chen、MIT航空航天学教授兼信息与决策系统实验室主任Sertac Karaman以及MIT电气工程与计算机科学副教授Kaiming He。

该研究起源于Lao Beyer在参加Kaiming He教授讲授的深度生成模型研究生课程时的一个课堂项目。项目过程中,Lao Beyer与He发现其研究潜力远超普通作业范畴,并逐渐吸引其他合作者加入。

研究起点为2024年6月由慕尼黑工业大学与中国字节跳动团队合作发表的论文,该论文提出了一种称为一维标记器的视觉信息表示方法。这种方法通过神经网络将256x256像素图像转换为仅由32个数字组成的序列,这些数字被称为标记。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1