GPT-5于北京时间2025年8月9日凌晨正式发布。该模型由OpenAI推出,是一个统一系统,包含智能快速模型gpt-5-main和深度推理模型gpt-5-thinking。
系统通过实时路由器动态选择使用模型,用户可通过提示词调用不同模型。路由器将根据使用情况持续训练改进。系统还包含迷你版、nano版及Pro版模型。
GPT-5在事实性错误减少方面表现突出,gpt-5-main比GPT-4o少44%,gpt-5-thinking比OpenAI o3少78%。在LongFact和FActScore基准测试中,幻觉率显著下降。
应对模型谄媚行为方面取得进展,免费用户中下降69%,付费用户中下降75%。新增四个性格预设选项,包括愤世嫉俗者、机器人、倾听者和书呆子。
在数学竞赛AIME 0225中,GPT-4 Pro+Python取得满分。现实世界编程能力和多模态能力达到新高。视觉推理、代理编程和研究生级别科学问题解决等能力提升显著,同时输出Token减少50-80%。
发布会展示的跑分图表存在数据矛盾问题,如52.8大于69.1等于30.8,50小于47.4等。Polymarket预测显示OpenAI与Google模型排名出现交叉跳水。
开发者定价为每百万token输入1.25美元,输出每百万token10美元。部分用户反映写作和情商能力不如GPT-4.5,但编程能力有显著提升。
实测显示GPT-5在生产级代码开发任务中表现优异,上下文精度极强。UI设计相比其他模型更少AI味,综合体验得到开发者认可。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。