OpenAI o3模型测试结果引发透明度质疑- DoNews快讯

DoNews > 快讯 > OpenAI o3模型测试结果引发透明度质疑

OpenAI o3模型测试结果引发透明度质疑

2025-04-21 07:34:02

187140

OpenAI的o3人工智能模型近期因第一方与第三方基准测试结果的显著差异，遭到外界对其透明度和测试实践的质疑。去年12月，OpenAI声称o3模型在FrontierMath数学问题集上正确率超过25%，远超竞争对手。然而，独立机构Epoch的测试显示，公开版本的o3模型得分仅为约10%。这一差距可能源于测试设置不同、计算资源差异或问题集版本更新。

尽管如此，OpenAI此前公布的测试结果中也包含较低分数，表明其并未刻意误导。此外，后续推出的o3-mini-high和o4-mini模型表现更优，一定程度上缓解了争议。此事件提醒业界，需谨慎对待来自商业公司的基准测试结果，尤其是在行业竞争日益激烈的背景下。类似争议还发生在其他公司，如xAI和Meta，进一步凸显了标准化测试的重要性。

不甘只当“打工仔”，享道出行闯关港股享道出行的发展已受制于人。

无人卡车厂家主线科技冲刺港股IPO，估值超38亿元主线科技拟港交所上市，2024年营收2.54亿，L4自动驾驶卡车市场份额31.8%，毛利率持续提升，亏损逐年收窄。

马矿股份IPO获上交所受理，计划募资10亿，中信证券保荐福建马坑矿业IPO获受理，拟募资10亿元，主营铁矿开发与综合利用，报告期内营收和净利稳中有升。

进军10万级家用市场，五菱星光要“为人民造车” 五菱星光要“为人民造车”

全球最大、最领先的吉利全球全域安全中心正式发布 2025年12月12日，吉利全球全域安全中心正式发布，并一举创下“全球最大的汽车安全试验室”、“全球最长的室内汽车碰撞测试跑道”、“全球最大的汽车环境

网信办通报：“东北雨姐”、“猫一杯”转世账号被关闭北京市网信办通报关闭“东北雨姐”、“猫一杯”等违规转世账号，整治网络乱象。

微牛证券第三季营收1.57亿美元：净利3680万美元微牛证券2025年前三季度营收4.06亿美元，同比增长45%；Q3净利3680万美元，同比扭亏，运营利润3670万美元。

Costco第一财季营收超预期增长8.2%，线上销售额飙升20% Costco第一财季营收增8.2%，电商销售暴增20.5%，会员达8140万，净利润增长11%，但股价年内累计下跌3.5%。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号