OpenAI开源医疗大模型测试集HealthBench- DoNews快讯

DoNews > 快讯 > OpenAI开源医疗大模型测试集HealthBench

OpenAI开源医疗大模型测试集HealthBench

2025-05-13 06:55:02

353496

5月12日，OpenAI发布医疗大模型测试评估集HealthBench。该测试集包含5000段核心对话，由60个国家/地区的262名医生设计，采用多轮对话形式，增强了难度与真实性。数据显示，大模型性能显著提升，如GPT-3.5Turbo从16%提升至GPT-4o的32%，再到o3的60%。小型模型GPT-4.1nano性能超越GPT-4o，且成本降低25倍。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

索尼 2024 财年净利润 1.14 万亿日元同比增长 18% 创历史新高 PS5 累计出货 7780 万台。

Soul App Z世代婚姻登记态度调研：领证是仪式感里程碑 91.2%的年轻人坚持法律保障。

Galaxy S25 Edge 发布；华为鸿蒙新品发布会定档；外卖平台企业被五部门约谈｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

传奇生物Q1营收同比增长107.5% CARVYKTI销售保持强劲增长高于预期。

DJI Mavic 4 Pro究竟如何重新定义旗舰？ DJI Mavic 4 Pro究竟如何重新定义旗舰？

虎牙2025年Q1财报：总收入15.1亿元企稳攀升。

京东物流 2025 年第一季度收入 469.67 亿元同比增长 11.5%。

京东发布 Q1 财报：收入达 3011 亿元，同比增长 15.8% 超预期。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号