AI编程能力仍不及人类工程师- DoNews快讯

DoNews > 快讯 > AI编程能力仍不及人类工程师

AI编程能力仍不及人类工程师

2025-02-24 09:35:02

222703

尽管OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）曾表示，到今年年底AI模型将超越“低级别”软件工程师，但该公司最新研究却表明，即使是目前最先进的AI模型，在编程任务上仍无法与人类相媲美。研究人员开发了名为SWE-Lancer的新基准测试工具，基于Upwork上的1400多个软件工程任务，对三款大型语言模型（LLMs）进行了测试，包括OpenAI的o1推理模型、GPT-4o以及Anthropic的Claude 3.5 Sonnet。

结果显示，这些前沿模型虽然能快速完成一些细节任务，但在处理复杂问题时表现不佳。它们仅能解决表面的软件问题，无法深入理解漏洞及其背景，导致解决方案“错误或不够全面”。即使在速度上远超人类，这些模型在处理大型项目时依然力不从心。研究人员指出，任何模型若想真正用于实际编程任务，都需要具备更高的可靠性。这表明，尽管AI发展迅速，但在软件工程领域，其技能水平仍不足以取代人类工程师。

蔡东青创办的奥动冲刺港股：靠换电半年营收3.2亿同比降32% 奥动新能源递表港交所，营收连年下滑，但已建成800余座换电站，覆盖60城，合作车企超16家，布局V2S2G与碳中和。

不甘只当“打工仔”，享道出行闯关港股享道出行的发展已受制于人。

无人卡车厂家主线科技冲刺港股IPO，估值超38亿元主线科技拟港交所上市，2024年营收2.54亿，L4自动驾驶卡车市场份额31.8%，毛利率持续提升，亏损逐年收窄。

马矿股份IPO获上交所受理，计划募资10亿，中信证券保荐福建马坑矿业IPO获受理，拟募资10亿元，主营铁矿开发与综合利用，报告期内营收和净利稳中有升。

进军10万级家用市场，五菱星光要“为人民造车” 五菱星光要“为人民造车”

全球最大、最领先的吉利全球全域安全中心正式发布 2025年12月12日，吉利全球全域安全中心正式发布，并一举创下“全球最大的汽车安全试验室”、“全球最长的室内汽车碰撞测试跑道”、“全球最大的汽车环境

网信办通报：“东北雨姐”、“猫一杯”转世账号被关闭北京市网信办通报关闭“东北雨姐”、“猫一杯”等违规转世账号，整治网络乱象。

微牛证券第三季营收1.57亿美元：净利3680万美元微牛证券2025年前三季度营收4.06亿美元，同比增长45%；Q3净利3680万美元，同比扭亏，运营利润3670万美元。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号