Anthropic公司8月6日发布最新模型Claude Opus 4.1,在编码、推理和执行指令能力方面较此前版本显著增强。相较5月发布的Claude Opus 4,新模型在软件工程准确性评估SWE-bench Verified中得分提升至74.5%。其在深度研究、数据分析及多文件代码重构方面表现尤为突出。Rakuten Group和Windsurf反馈称,Opus 4.1在修正代码错误和开发者基准测试中展现更强稳定性与性能提升。该模型现已通过多种平台开放使用,更多升级也将在未来几周陆续推出。
Anthropic公司8月6日发布最新模型Claude Opus 4.1,在编码、推理和执行指令能力方面较此前版本显著增强。相较5月发布的Claude Opus 4,新模型在软件工程准确性评估SWE-bench Verified中得分提升至74.5%。其在深度研究、数据分析及多文件代码重构方面表现尤为突出。Rakuten Group和Windsurf反馈称,Opus 4.1在修正代码错误和开发者基准测试中展现更强稳定性与性能提升。该模型现已通过多种平台开放使用,更多升级也将在未来几周陆续推出。