百度AI引入Agent与百科信源显著提升事实准确率- DoNews

研究人员发现，大语言模型存在固有局限性，无法自主验证信息真伪，易产生幻觉。2024年3月，瑞典哥德堡大学一名医学研究员虚构名为‘蓝光狂躁症’的病症并发布于预印本平台，作者单位标注为‘星际舰队学院’，但包括ChatGPT、Gemini在内的主流AI均采信该虚假论文，向用户输出错误诊断建议。

类似问题亦见于金融领域：有用户提问某上市公司年报分析，AI生成详尽报告，实则该公司尚未发布年报。模型在被指出错误后仍可能重复出错，因其底层机制为概率化文本生成，不具事实核查能力。

为应对该缺陷，业界发展出Agent架构——使AI具备主动检索、多源交叉验证及结果核验能力。无Agent的AI在未检索到年报时倾向于编造内容；而配备Agent的AI会定向访问指定信息披露平台，若未查得则明确回应‘未找到’。当前Grok、Claude及国内Kimi等已部署Agent功能，部分需付费订阅。

在AI应用平台‘龙虾’生态中，用户安装量最高的Skill为‘百度搜索’，反映其在中文信息检索准确性上的实际优势。百度在万象大会上宣布，其AI系统已集成双Agent协同机制：两个独立Agent分别执行深度搜索与交叉比对，显著降低虚假信息生成概率。

百度百科作为核心信源，实施严格内容治理：所有词条须标注权威引用来源，排除自媒体与UGC内容；实行先发后审制度；联合中国科学院大学等机构完成20余万科学类词条审定，覆盖全部自然科学领域。人大教授宋瞳在明史教学中指出，非专业研究者获取可靠史料，首选即为百度百科，其中甚至收录未刊印孤本如明代许士德《戎车日记》。

果壳网双盲测试显示，在接入百度百科作为参考信源后，8家主流AI综合准确率平均提升38%以上，关键事实偏离率由26.4%降至4.1%以内，专家认可度达91.5%。百度还部署秒级人工巡查与干预机制，确保同一问题在不同时间点的回答一致性与正确性。

依托Agent能力，百度AI进一步增强需求理解力：询问月球知识可生成可交互三维模型；查询黄河信息则自动呈现流经城市地理路径。系统不再仅作被动应答，而是基于任务意图提供结构化、可视化响应。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。