美国密歇根大学研发了一种名为开放即兴分类(OAK)的方法,可帮助人工智能系统根据不同的分类情境,动态解读同一图像。
该方法突破传统图像分类的固定模式,使AI能够像人类一样根据任务、情境或目标调整图像含义。
研究人员通过扩展OpenAI的CLIP模型构建该系统,并添加上下文标记,使AI能够自然聚焦于图像的不同区域。
例如,一张人在喝水的图片可被归类为“喝水”、“在商店”或“开心”,具体分类取决于应用情境。
该技术有望应用于机器人技术、视觉识别等多个领域,提升AI在复杂环境下的图像理解能力。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。