一项MIT最新研究显示,生成式AI在医疗领域的应用仍存在较大风险。研究发现,用户提问时的拼写错误或使用非正式语言可能导致AI误判病情,建议“无需就医”的概率上升7%至9%。部分AI工具甚至因输入形式差异给出矛盾答案。
女性用户相较男性更易受此类误差影响,尽管结论尚待进一步验证。研究测试了GPT-4、LLaMA-3-70B及Palmyra-Med等模型,模拟数千真实病例并引入扰动因素,揭示其在实际应用中的局限性。
微软近期推出的AI医疗工具虽宣称“准确率超医生”,但研究提醒,在高复杂度领域,AI的表现仍未达到完全可靠水平,需谨慎评估其落地可行性。