微软亚洲研究院近日推出名为UI-Evol的新组件,旨在应对计算机使用AI智能体在图形用户界面操作中面临的“知识-行动鸿沟”问题。当前智能体虽能获取高准确率指令,任务成功率却不足一半,且行为不稳定。UI-Evol通过“回溯”与“审校”两阶段机制,记录并优化智能体的实际操作轨迹,动态对齐外部知识与真实界面环境。实验显示,集成该组件后,基于GPT-4o等模型的智能体在OSWorld基准测试中任务成功率显著提升,行为标准差降低,执行过程更可靠稳定。研究成果已入选ICML 2025相关研讨会。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



