Claude Opus 4.8 上线:提升 AI 编程可靠性,减少无依据结论

DoNews5月29日消息,Anthropic 5 月 29 日宣布推出旗舰新模型 Claude Opus 4.8,主打更强的智能体编程、多领域推理和知识工作能力。

官方表示,相比较 Opus 4.7 模型,本次 Opus 4.8 更新幅度较小,在保持价格不变的情况下,主要提升编程、智能体、推理和知识工作等用户能感知的方面。

能力层面,官方援引多家早期测试方反馈称,表示 Opus 4.8 “更可靠,判断也更敏锐”,在复杂多步骤任务中判断更稳,能主动提问、识别自身错误,并在计划不合理时提出异议。

官方评估显示,和前代相比,Opus 4.8 放任自己所写代码缺陷、却不加说明的概率降低至四分之一,更愿意主动标出不确定性,减少缺乏依据的结论。

对齐表现方面,Opus 4.8 在支持用户自主性、按用户最佳利益行动等亲社会指标上创下新高。与此同时,欺骗等失配行为的出现率低于 Opus 4.7,并与 Claude Mythos Preview 接近。

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号