OpenAI发布AI健康系统评估标准HealthBench- DoNews

DoNews > 公司新闻 > OpenAI发布AI健康系统评估标准HealthBench

OpenAI发布AI健康系统评估标准HealthBench

推荐 2025-05-14 10:55:03

OpenAI推出AI健康系统评估标准HealthBench，用于评测大模型的医疗表现。

HealthBench与262名来自60个国家的执业医生合作建立，包含5000个真实健康对话，每个对话配有医生制定的评分标准，总计48562个独特评分标准。

通过该体系，OpenAI对多款大模型进行了评测，包括O3、Gemini 2.5 Pro和Claude 3.7 Sonnet。结果显示，OpenAI自家的o3模型得分最高，排名第一，Grok 3和Gemini 2.5 Pro分别位列第二和第三。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

问止中医再闯港交所，“AI+中医”难掩亏损困局问止中医急于叩开资本市场的大门

影石CEO微博发文庆祝大疆全景相机上市大疆发布首款全景相机Osmo 360 8K，影石CEO刘靖康祝贺并宣传自家产品，影石此前已进入无人机市场。

多家造纸企业宣布上调纸价；八部门印发方案：目标到2027年建成不少于200家卓越级智能工厂；广电总局：正式启动虚假宣传医药广告集中整治工作｜Do早报大家早上好，又是元气满满的一天，一起浏览今天的早报吧～

奕派科技重磅发布“未来之翼”战略，为用户派生无限精彩奕派科技战略发布会盛大召开

TCL华星“屏宇宙”进阶亮相2025ChinaJoy，打造电竞显示产业发展新的增长极打造电竞显示产业发展新的增长极

智己行业首发“恒星”超级增程，1500公里都是顶级电车体验是增程，更是“自带超充桩的电车”。

全新上汽奥迪A5L Sportback正式上市售价25.99万元起全新上汽奥迪A5L Sportback上市，限时价25.99万元起，提供多重购车礼遇，搭载华为乾崑技术，融合智能与豪华设计。

九号公司上半年营收117.4亿元，同比增长76.1% 九号公司上半年营收117.42亿元，净利12.42亿元，智能电动两轮车业务增长迅猛。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号