月之暗面(Moonshot AI)宣布推出自主智能体 Kimi-Researcher,该产品基于自研 Kimi k 系列模型内部版本,通过端到端智能体强化学习训练而成。
这款 Agent 擅长多轮搜索与推理,平均每次任务执行约23个推理步骤,并访问超过200个网址,是国内少见的由自研模型打造的智能体。
在 HLE 基准测试中,Kimi-Researcher 的 Pass@1 成绩达到26.9%,刷新当前最佳水平(SOTA),Pass@4 准确率为40.17%。此外,在 xbench-DeepSearch 等多个复杂基准测试中,其平均 Pass@1 成绩高达69%,超越 o3 等带有搜索工具的模型。
除了测试表现优异,Kimi-Researcher 还能够解决实际问题,例如动画电影识别和学术研究支持。公司计划在未来几个月内开源其依赖的基础预训练模型及强化学习模型,以展示端到端智能体强化学习对提升 Agent 智能的潜力。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。