苹果公司确认将参加2025年10月19日至23日在檀香山举行的国际计算机视觉大会(ICCV)。
ICCV每年与欧洲计算机视觉会议(ECCV)交替举行,聚焦计算机视觉领域的关键议题。
苹果共有八篇论文被大会录用,内容涵盖多模态模型、视频生成与评估等方向,这些论文将在大会的海报展示和口头报告环节呈现。
苹果机器学习应用研究部经理C. Thomas博士将出席第三届基于视觉的工业检测研讨会(VISION),并发表主题演讲,具体演讲主题将于近日公布,演讲时间为10月19日。
苹果在ICCV 2025上展示的八篇论文分别为:ETVA:通过细粒度问题生成与回答实现文本到视频对齐的评估;MM-Spatial:探索多模态大语言模型中的三维空间理解能力;原生多模态模型的扩展规律研究;稳定扩散模型在视觉上下文学习中表现出隐性优势;STIV:可扩展的文本与图像条件化视频生成方法;UINavBench:交互式数字智能体综合评估框架;基于多模态提示的统一开放世界分割技术;UniVG:用于统一图像生成与编辑的通用扩散模型。
此外,苹果还将参与“计算机视觉领域女性研讨会”(Women in Computer Vision Workshop),研究人员Patricia Vitoria Carrera与Tanya Glozman将在会后晚宴上担任导师。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。