智谱宣布正式开源其AI Agent模型AutoGLM,该模型具备稳定执行外卖点单、机票预订等数十步复杂操作流程的能力,被业界视为具有“Phone Use”功能的智能体。
自2023年4月起,智谱开始研发AutoGLM。初期版本仅能识别“点击”“滑动”等基础操作,常在执行中迷失或陷入死循环。为提升稳定性,团队耗时近一年构建了完整的Phone Use能力框架,将点击、滑动、输入、截图和界面理解等动作抽象化,使模型可将自然语言指令拆解为可回放的操作序列,并有效应对网络波动、弹窗干扰、广告遮挡等现实问题。
2024年10月25日,智谱发布可在真机上稳定运行完整操作链路的AutoGLM版本;一个月后,成功展示由AI自动发出手机红包的实例。2025年,团队推出AutoGLM 2.0,验证强化学习的规模扩展定律,提出MobileRL、ComputerRL与AgentRL算法,实现在上千个虚拟设备环境中并行强化学习,显著提升模型准确性与泛化能力。
此次开源允许硬件厂商、手机制造商及开发者在其系统中集成具备屏幕理解与真人模拟操作能力的AI助手。目前AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其功能表现与此前引发关注的“豆包手机”演示相近。
项目支持本地与云端双重部署模式,确保用户对数据与隐私拥有完全控制权。开源举措有望降低AI手机技术门槛,推动行业从封闭生态向开放共创转型。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



