OpenAI 推出医疗大模型评估集 HealthBench 并开源- DoNews快讯

DoNews > 快讯 > OpenAI 推出医疗大模型评估集 HealthBench 并开源

OpenAI 推出医疗大模型评估集 HealthBench 并开源

2025-05-13 11:20:02

543602

OpenAI 近日发布了一个专注于医疗大模型的测试评估集 HealthBench，并宣布开源。这一测试集由来自 60 个国家和地区的 262 名医生共同打造，包含 5000 段核心测试对话，极大提升了评估的真实性与复杂性。HealthBench 不仅覆盖紧急情况、全球健康等多元背景，还通过 48562 个独特的评分标准对模型的准确性、沟通能力等多维度进行开放式评估。

与传统单一答题模式不同，HealthBench 引入多轮对话测试，显著提升评估深度。数据显示，从 GPT-3.5 Turbo 到 GPT-4o 再到 o3，模型性能逐步提高，尤其是小型模型 GPT-4.1nano，在超越 GPT-4o 的同时，成本降低 25 倍，展现了医疗领域大模型的巨大潜力。

完美世界发布贪腐公告，涉及多个工作室核心人员完美世界公告多名员工受贿、违规操作被辞退或刑拘，涉及多个工作室及供应商，公司已报案并列入黑名单。

李彦宏内部信宣布新一轮干部轮岗：何海建出任CFO 百度宣布新一轮组织调整，何海建任CFO，何俊杰轮岗负责HR，崔珊珊专任文化委员会秘书长。

京东加码“AI人才争夺战” 京东通过TGT项目招募AI人才，覆盖多领域并推动大模型应用创新。

面板厂家惠科IPO申请正式获理惠科股份IPO获受理，拟募资85亿元用于OLED、Mini-LED等项目及偿还贷款。

美ONE出海印尼9个月，以惨败收场美ONE印尼业务MTYN直播带货遇挫，月均GMV不足10万美元，主因去李佳琦化、投入失衡及本地化不足。

比亚迪第 100 万辆海鸥正式下线；《哪吒 2》最终票房出炉；小米上周新增锁单破 28 万｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

Meta宣布正式成立超级智能实验室 11名顶尖人才曝光 Meta重组AI团队成立超级智能实验室，由Alexandr Wang领导，并公布11位顶尖人才加盟。

洪恩公布2025年第一季度未经审计财务业绩洪恩2025年第一季度营收2.104亿元，净利润2650万元，MAU达2651万。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号