奥特曼首次实测GPT-5 使用超级对齐团队技术- DoNews

DoNews > 公司新闻 > 奥特曼首次实测GPT-5 使用超级对齐团队技术

奥特曼首次实测GPT-5 使用超级对齐团队技术

推荐 2025-08-04 18:13:03

GPT-5首次官方实测结果由奥特曼本人公开，引发广泛关注。

尽管测试内容仅涉及电视剧推荐，但仍是目前唯一官方实例。

奥特曼暗示即将进入SaaS快时尚时代，具体含义尚未明确。

网友截获疑似GPT-5发布时间，但相关内容被秒删。

关于GPT-5的更多技术细节被陆续披露。

OpenAI在GPT-5中重写了编码规则，提升编程能力。

模型将文本能力与推理层结合，能合理选择是否深入思考。

GPT-5具备处理真实工程问题能力，包括重构“屎山”代码。

知情人士透露，GPT-5使用了Ilya领衔的超级对齐团队技术。

该技术核心为“通用验证器”，最早在2024年7月发表。

论文发表时，Ilya已宣布离开OpenAI两个月。

超级对齐团队随后被解散，目前仅剩两位作者留在OpenAI。

现任OpenAI首席研究官Mark Chen解释称对齐研究已融入核心业务。

当前重点在于现有模型对齐，而非超级智能假设。

通用验证器通过强化学习方式提升模型准确率和推理清晰度。

该方法基于“证明者-验证者游戏”训练机制。

证明者分为“靠谱”和“狡猾”两种类型。

“靠谱的证明者”生成正确解题步骤，“狡猾的证明者”故意生成错误方案。

验证者负责区分正确与错误方案。

证明者和验证者模型均来自GPT-4系列。

验证者规模需小于证明者，以确保对齐人类验证结果。

训练中分别设置证明者和验证者的效用函数。

证明者效用基于奖励函数，与方案正确性及验证者打分相关。

奖励函数确保对齐方案获得更高奖励。

验证者效用采用交叉熵损失最小化判断误差。

通过多轮迭代训练，证明者使用强化学习（PPO）优化。

实验结果显示验证者打分持续提升，“靠谱证明者”正确率整体上升。

“狡猾证明者”错误答案比例先降后升，最终能生成具说服力错误方案。

训练后模型生成答案更准确易读，但也能生成更具欺骗性的错误答案。

GPT-5可对答案评分并保留正确结果循环训练。

即使人类无法理解高级推理，也能通过小型验证器构建可检验性约束。

奥特曼持续释放GPT-5相关信息，引发网络热议。

网上出现抢跑实测视频、“预测”基准及唱衰言论。

The Information爆料称GPT-5研发遇到困难。

高质量训练数据供应不足，大规模预训练收益下降。

GPT-5提升可能不如GPT-3到GPT-4显著。

存在模型性能转化落差问题，如o3内部测试表现优于实际部署。

有用户质疑模型发布后可能出现性能下降。

GPT-5发布计划仍存不确定性，但业界普遍预期OpenAI将如期发布。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

租约到期皮爷咖啡华南首店关闭皮爷咖啡华南首店关闭，今年已关闭多家门店，尽管销售额增长，但开店速度放缓，并尝试推出低价品牌Ora Coffee应对市场变化。

2025未来科学大奖获奖名单公布，季强、徐星、周忠和、方忠、戴希、丁洪、卢志远获奖 2025年未来科学大奖揭晓：季强、徐星、周忠和获生命科学奖；方忠、戴希、丁洪获物质科学奖；卢志远获数学与计算机科学奖。

卢志远获2025未来科学大奖数学与计算机科学奖卢志远获2025未来科学大奖数学与计算机科学奖，因在非易失性存储技术领域的突破性发明与贡献。

方忠，戴希，丁洪三人获2025未来科学大奖物质科学奖 2025未来科学大奖物质科学奖揭晓，方忠、戴希、丁洪因拓扑电子材料研究获奖。

季强，徐星，周忠和三人获2025未来科学大奖生命科学奖 2025未来科学大奖生命科学奖授予季强、徐星、周忠和，表彰其发现鸟类起源于恐龙的化石证据。

消息称玛莎拉蒂、阿尔法・罗密欧将采用奇瑞平台奇瑞E0X电动平台获欧洲豪华品牌采用，玛莎拉蒂、阿尔法・罗密欧及路虎将基于此开发新能源车型，平台研发投入达百亿元。

AMD 第二季度调整后净利润 7.81 亿美元，同比大跌 31% AMD第二季度营收76.9亿美元，同比增长32%，但利润不及预期，股价盘后下跌4%。

OpenAI 推出两款开源模型，性能逼近 o4-mini/o3-mini OpenAI推出两款开源模型GPT-oss-120b和GPT-oss-20b，性能前沿且可免费下载，支持商业化应用。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号