生成式AI医疗应用受质疑,用户提问方式影响诊断准确性

一项MIT最新研究显示,生成式AI在医疗领域的应用仍存在较大风险。研究发现,用户提问时的拼写错误或使用非正式语言可能导致AI误判病情,建议“无需就医”的概率上升7%至9%。部分AI工具甚至因输入形式差异给出矛盾答案。

女性用户相较男性更易受此类误差影响,尽管结论尚待进一步验证。研究测试了GPT-4、LLaMA-3-70B及Palmyra-Med等模型,模拟数千真实病例并引入扰动因素,揭示其在实际应用中的局限性。

微软近期推出的AI医疗工具虽宣称“准确率超医生”,但研究提醒,在高复杂度领域,AI的表现仍未达到完全可靠水平,需谨慎评估其落地可行性。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1