OpenAI模型IOI夺金，但不敌三位中国高中生- DoNews

OpenAI官方宣布，其AI推理模型在IOI线上竞赛中取得突破性成绩。总分达到533.29，在330名人类选手中排名第6，且在所有AI参赛者中排名第一。

值得一提的是，排名高于该AI的五位选手中，有三位是中国高中生：刘恒熙（宁波市镇海中学）、范斯喆（浙江省诸暨市海亮高级中学）、陈昕阳（杭州第二中学）。

OpenAI表示，此次并未专门训练新模型参赛，而是整合多个通用推理模型完成比赛。此次使用的系统与之前声称在IMO竞赛中夺金的系统相同。

相比去年的表现，今年的提升显著。在IOI 2024中，OpenAI使用了专门针对编程任务进行强化学习微调的o1-ioi模型，尽管采用复杂的人工设计test-time推理策略，包括生成10000个候选解、聚类排序并筛选最终方案，但仅获得213分，位列第49百分位。

本次比赛规则与人类选手相同，包括5小时时间限制和50次提交次数限制。AI系统全程未使用互联网或检索增强生成（RAG）技术，仅使用基础终端工具。

在比赛中，AI通过API获取题目并提交解答，未接受竞赛组织者的直接监督。其表现超越了98%的人类选手，无论从成绩还是方法上，均较去年有明显改进。

尽管取得亮眼成绩，部分网友仍对AI在竞赛中的表现持谨慎态度，质疑其是技术突破还是营销噱头。

此外，马斯克也参与讨论，发布了IOI Benchmark排名，称Grok 4在编码方面超越GPT-5获得第一（doge）。

与此同时，谢赛宁团队推出的LiveCodeBench Pro竞赛级编程问题基准测试中，GPT-5 Thinking在2025年第一季度测试组中完成突破，成为唯一解出难题分组的模型。其平均响应长度超过10万token，是o3的三倍。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。