OpenAI官方宣布,其AI推理模型在IOI线上竞赛中取得突破性成绩。总分达到533.29,在330名人类选手中排名第6,且在所有AI参赛者中排名第一。
值得一提的是,排名高于该AI的五位选手中,有三位是中国高中生:刘恒熙(宁波市镇海中学)、范斯喆(浙江省诸暨市海亮高级中学)、陈昕阳(杭州第二中学)。
OpenAI表示,此次并未专门训练新模型参赛,而是整合多个通用推理模型完成比赛。此次使用的系统与之前声称在IMO竞赛中夺金的系统相同。
相比去年的表现,今年的提升显著。在IOI 2024中,OpenAI使用了专门针对编程任务进行强化学习微调的o1-ioi模型,尽管采用复杂的人工设计test-time推理策略,包括生成10000个候选解、聚类排序并筛选最终方案,但仅获得213分,位列第49百分位。
本次比赛规则与人类选手相同,包括5小时时间限制和50次提交次数限制。AI系统全程未使用互联网或检索增强生成(RAG)技术,仅使用基础终端工具。
在比赛中,AI通过API获取题目并提交解答,未接受竞赛组织者的直接监督。其表现超越了98%的人类选手,无论从成绩还是方法上,均较去年有明显改进。
尽管取得亮眼成绩,部分网友仍对AI在竞赛中的表现持谨慎态度,质疑其是技术突破还是营销噱头。
此外,马斯克也参与讨论,发布了IOI Benchmark排名,称Grok 4在编码方面超越GPT-5获得第一(doge)。
与此同时,谢赛宁团队推出的LiveCodeBench Pro竞赛级编程问题基准测试中,GPT-5 Thinking在2025年第一季度测试组中完成突破,成为唯一解出难题分组的模型。其平均响应长度超过10万token,是o3的三倍。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。