MIT 研究揭示提问方式影响 AI 医疗判断可靠性- DoNews

DoNews > 公司新闻 > MIT 研究揭示提问方式影响 AI 医疗判断可靠性

MIT 研究揭示提问方式影响 AI 医疗判断可靠性

推荐 2025-07-10 20:17:03

随着生成式人工智能（AI）技术不断发展，其应用已扩展至复杂任务，但对非专业用户而言，如何高效准确使用这些工具仍具挑战。

一份独立报告显示，微软 AI 部门收到的用户投诉中，最常见的是“Copilot 不如 ChatGPT 好用”。微软将问题归因于用户提示词工程能力不足，并推出“Copilot 学院”以提升用户体验。

麻省理工学院（MIT）的一项最新研究指出，过度依赖 AI 工具获取医疗建议可能带来风险。研究显示，提问时出现拼写错误、多余空格、花哨语言或俚语可能导致 AI 给出错误判断，例如建议用户无需就医。

女性用户相较男性更容易受到此类错误建议影响，尽管该结论尚待进一步验证。研究测试了 GPT-4、LLaMA-3-70B 及 Palmyra-Med 等多个 AI 工具，模拟了数千个健康案例，数据来源于真实患者投诉、Reddit 帖子及 AI 生成病例。

研究人员在数据中加入扰动因素，包括大小写不一致、感叹号、情绪化语言等不确定表达，结果导致 AI 建议用户“无需就医”的概率上升 7% 至 9%。

MIT 研究负责人阿比尼塔・古拉巴蒂娜表示，这些模型通常基于医学考试训练，但在实际临床评估中表现仍有差距，人类对其理解仍有限。

这一发现引发对 AI 在医疗领域应用的担忧。此前微软宣布其新 AI 医疗工具“准确率是医生 4 倍”，并称其为“迈向医疗超级智能的一步”。

然而，研究再次提醒，在高度复杂的医疗领域，生成式 AI 远未达到完全可靠水平，需更多验证与审慎评估方可投入使用。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

英伟达首次亮相链博会；京东外卖投入 20 亿升级全职骑手福利；尚界 H5 官宣 9 月发布｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

ASML公布2025Q2财报：净利润为23亿欧元 ASML2025年Q2财报达预期上限，净销售额77亿欧元，毛利率53.7%，预计Q3销售额74-79亿欧元，全年增长15%。

岚图宣布全系车型升级终身免费三电质保岚图全系车型升级终身免费三电质保，定义高端新能源服务新标杆。

知情人士：娃哈哈宗庆后不止4个孩子宗庆后除宗馥莉外另有6子，包括杜建英所生3子女及员工所生3子女，网传与保姆所生子不实。

王莆中回应美团抽佣20%：技术服务费平均不到8% 美团CEO回应抽佣质疑，称实际抽佣约8%，配送费另计，净利率约4%，强调需加强沟通。

美团王莆中谈外卖大战：没有意义，绝大部分是泡沫美团CEO王莆中称即时零售市场存在大量泡沫，质疑行业冲单行为的实际价值，并呼吁反思其对社会和产业的影响。

火狐浏览器被曝将终止中国账户并关闭北京公司火狐浏览器或终止中国区账户并关闭北京公司，用户可继续使用国际版。

关于网络反映黄杨某甜“天价耳环”有关问题调查处理情况的通报雅安市通报杨某违规经商、隐瞒生育及网络关注问题处理结果。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号