近日,Agnes AI旗下Agnes-2.0-Flash与Agnes-Image-2.0-Flash模型同时进入ClawEval与Artificial Analysis国际评测榜单前列,推动Agnes正式位列全球AI Lab第9位。
ClawEval聚焦真实Agent场景下的综合执行能力,区别于传统数学、知识问答或代码类Benchmark,其评测更贴近AI模型在实际任务中的完成效果。Agnes-2.0-Flash在部分任务中表现优于Gemini Flash与MiniMax M2.7等主流模型。
Artificial Analysis的Image Editing Leaderboard采用真实用户盲评机制,参评者不知晓图像所对应模型来源,仅依据生成质量进行主观选择与打分。Agnes-Image-2.0-Flash由此进入该榜单,表明其图像编辑能力已达国际主流水平。
值得注意的是,Agnes上榜模型均为轻量级高效率架构,在更低推理成本与GPU资源消耗前提下实现全球前列排名。
在定价方面,Agnes-2.0-Flash官方API报价为每百万输入tokens 0.03美元、输出tokens 0.15美元,约为DeepSeek V4 Flash价格的一半;Agnes-Image-2.0-Flash定价为3美元/1000张图片,显著低于行业平均约30美元/1000张图片的水平。
Agnes未采取单纯扩大参数规模路径,而是聚焦推理效率优化、Agent场景适配、多模型协同、低成本部署及高性价比输出。其模型能力与Harness系统已服务数千万用户,应用于AI内容生成、自动化工作流、网页操作、多模态创作及开发者工具等场景。
当前AI行业正从Chatbot阶段转向Agent阶段,对模型的要求由“回答问题”转向“完成任务”。Agnes的实践标志着全球AI竞争维度扩展至模型能力、效率、成本与大规模落地能力的综合比拼。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



