月之暗面发布自研Agent Kimi-Researcher，内测成绩刷新行业记录- DoNews

DoNews > 公司新闻 > 月之暗面发布自研Agent Kimi-Researcher，内测成绩刷新行业记录

月之暗面发布自研Agent Kimi-Researcher，内测成绩刷新行业记录

推荐 2025-06-23 10:06:03

月之暗面（Moonshot AI）宣布推出自主智能体 Kimi-Researcher，该产品基于自研 Kimi k 系列模型内部版本，通过端到端智能体强化学习训练而成。

这款 Agent 擅长多轮搜索与推理，平均每次任务执行约23个推理步骤，并访问超过200个网址，是国内少见的由自研模型打造的智能体。

在 HLE 基准测试中，Kimi-Researcher 的 Pass@1 成绩达到26.9%，刷新当前最佳水平（SOTA），Pass@4 准确率为40.17%。此外，在 xbench-DeepSearch 等多个复杂基准测试中，其平均 Pass@1 成绩高达69%，超越 o3 等带有搜索工具的模型。

除了测试表现优异，Kimi-Researcher 还能够解决实际问题，例如动画电影识别和学术研究支持。公司计划在未来几个月内开源其依赖的基础预训练模型及强化学习模型，以展示端到端智能体强化学习对提升 Agent 智能的潜力。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

腾讯阅文旗下APP筑梦岛被曝色情擦边遭约谈筑梦岛等AI情感陪伴应用被曝涉未成年人不良内容，上海网信办已约谈并要求整改。

大疆首款扫拖机器人ROMO或将于本月发布大疆发布首款扫拖机器人DJI ROMO，采用透明设计，已量产并计划6月上市，定位中高端市场。

无锡斯坦德机器人冲刺港交所：小米为投资方斯坦德机器人计划港股上市，2024年营收2.51亿元，复合年增长61.3%，为全球第五大工业智能移动机器人提供商。

比亚迪回应海豹将用上固态电池传闻：不实消息比亚迪回应固态电池传闻，称目前未知，预计2027年示范装车，2030年大规模应用。

抖音官方辟谣商业化副总裁浦燕子离职传闻字节跳动商业化副总裁浦燕子被传离职，抖音官方澄清为AI生成谣言。

OpenAI 与苹果前首席设计师合作项目遭起诉商标侵权 OpenAI与JonyIve合作项目io因商标争议下架，设备定位为继手机后的新核心设备，支持环境感知和语音交互。

雷军：小米YU7价格超20万销量要挑战Model Y 小米将于6月26日发布新车YU7，挑战特斯拉Model Y销量，配置高端，预计售价26万至30万元。

51WORLD再冲港股IPO：研发费用缩水收入不及竞争对手 51WORLD四度冲击IPO，面临持续亏损、现金流紧张及研发支出缩减等问题，毛利率下滑，商业化前景存疑。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号