百度AI引入Agent与百科信源显著提升事实准确率

研究人员发现,大语言模型存在固有局限性,无法自主验证信息真伪,易产生幻觉。2024年3月,瑞典哥德堡大学一名医学研究员虚构名为‘蓝光狂躁症’的病症并发布于预印本平台,作者单位标注为‘星际舰队学院’,但包括ChatGPT、Gemini在内的主流AI均采信该虚假论文,向用户输出错误诊断建议。

类似问题亦见于金融领域:有用户提问某上市公司年报分析,AI生成详尽报告,实则该公司尚未发布年报。模型在被指出错误后仍可能重复出错,因其底层机制为概率化文本生成,不具事实核查能力。

为应对该缺陷,业界发展出Agent架构——使AI具备主动检索、多源交叉验证及结果核验能力。无Agent的AI在未检索到年报时倾向于编造内容;而配备Agent的AI会定向访问指定信息披露平台,若未查得则明确回应‘未找到’。当前Grok、Claude及国内Kimi等已部署Agent功能,部分需付费订阅。

在AI应用平台‘龙虾’生态中,用户安装量最高的Skill为‘百度搜索’,反映其在中文信息检索准确性上的实际优势。百度在万象大会上宣布,其AI系统已集成双Agent协同机制:两个独立Agent分别执行深度搜索与交叉比对,显著降低虚假信息生成概率。

百度百科作为核心信源,实施严格内容治理:所有词条须标注权威引用来源,排除自媒体与UGC内容;实行先发后审制度;联合中国科学院大学等机构完成20余万科学类词条审定,覆盖全部自然科学领域。人大教授宋瞳在明史教学中指出,非专业研究者获取可靠史料,首选即为百度百科,其中甚至收录未刊印孤本如明代许士德《戎车日记》。

果壳网双盲测试显示,在接入百度百科作为参考信源后,8家主流AI综合准确率平均提升38%以上,关键事实偏离率由26.4%降至4.1%以内,专家认可度达91.5%。百度还部署秒级人工巡查与干预机制,确保同一问题在不同时间点的回答一致性与正确性。

依托Agent能力,百度AI进一步增强需求理解力:询问月球知识可生成可交互三维模型;查询黄河信息则自动呈现流经城市地理路径。系统不再仅作被动应答,而是基于任务意图提供结构化、可视化响应。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1