AI模型难辨信念与事实，斯坦福研究揭示潜在风险- DoNews快讯

DoNews > 快讯 > AI模型难辨信念与事实，斯坦福研究揭示潜在风险

AI模型难辨信念与事实，斯坦福研究揭示潜在风险

2025-11-07 09:16:03

412966

斯坦福大学最新研究显示，包括ChatGPT、Claude、DeepSeek和Gemini在内的24款主流AI语言模型在区分用户信念与客观事实方面存在显著缺陷。研究团队通过13,000个问题测试发现，模型在面对“我相信……”类陈述时，识别虚假信念的能力明显弱于真实信念，较新模型识别准确率下降34.3%。GPT-4o在特定任务中准确率从98.2%骤降至64.4%，DeepSeek R1更跌至14.4%。论文强调，知识必须基于真实，而当前多数模型缺乏对此的稳健理解，尤其在法律、医学等高风险领域应用可能引发严重误判。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

移卡发布年度业绩，股东应占利润9224.4万元同比增加11.88% 移卡2025年营收33.11亿元，增7.25%；净利9224.4万元，增11.88%；海外GPV增323.3%，国内支付费率升至12.3基点。

小赢科技发布2025年财报：净利润14.646亿元小赢科技2025财年净收入76.394亿元，净利润14.646亿元；服务小微主体超970万件；依托AI构建WinPROT风控体系及数字人Win-Daidai强化消保。

味多美被指拒招北京本地人，HR先称“公司规定”后改口否认味多美被曝招聘中拒绝北京户籍求职者，引发歧视争议；HR回应称无统一户籍限制，但多位应聘者证实遭遇明确拒录。

中国移动 2025 年营收 1.05 万亿元，同比增长 0.9% 中国移动2025年营收1.05万亿元，增0.9%；股东应占利润1371亿元，降0.9%；股息每股5.27港元，增3.5%；5G客户6.42亿，渗透率63.9%；卫星通信进入商业化。

尼康尼克尔 Z 70-200mm f/2.8 VR S Ⅱ长焦镜头发售，售价19,999元尼康发布尼克尔Z 70-200mm f/2.8 VR S II镜头，重约998g，减重26%，AF速度提升3.5倍，支持6档协同防抖，售价19999元。

消息称月之暗面评估赴港 IPO 月之暗面正评估赴港IPO，已接触中金、高盛；同步推进最高10亿美元融资，估值或达180亿美元；Kimi模型升级支持多模态。

特步国际2025净利润上升10.8%创历史新高特步2025年营收141.51亿元（+4.2%），净利润13.72亿元（+10.8%），专业运动分部收入增30.8%，海外电商增超220%，持续巩固‘中国跑步第一股’地位。

大众回应斯柯达将退出中国：销售到年中，持续提供售后斯柯达在华销售至2026年中，之后持续提供售后；大众称中国仍是全球战略核心，正加码智能网联研发。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号