2026年6月6日,北卡罗来纳大学教堂山分校与美国东北大学联合发布未经过同行评审的新研究。研究团队构建SVI-bench基准(含3.5万小时赛事视频、1500万条回合标注等),测试ChatGPT、Gemini、千问等模型在感知、推理、模拟和自主分析四方面能力。结果显示:基础动作识别准确率仅74%;因果推理成功率约40%;模拟能力接近随机;自主分析准确率低至5%。研究人员指出,AI尚无法理解‘为何发生’或‘将如何发展’,凸显其在深层认知任务上的根本局限。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



