13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%- DoNews

DoNews > 公司新闻 > 13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

IT之家 2024-04-18 11:35:39

AI 安全公司 DeepKeep 近日发布评估报告，在 13 个风险评估类别中，Meta 公司的 Llama 2 大语言模型仅通过 4 项测试。

报告称 70 亿参数的 Llama 2 7B 模型幻觉（回答内容存在虚假，或者有误导性内容）最为严重，幻觉率高达 48%。

DeepKeep 表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造回答的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。

除了幻觉问题之外，Llama 2 大语言模型还存在注入和操纵等问题。根据测试结果，80% 的场景下通过“提示注入”的方式，可以操纵 Llama 的输出，意味着攻击者可以“戏弄”Llama，将用户引导到恶意网站。

IT之家附上参考地址

LlamaV2 7B: hallucination, susceptibility to DoS attacks and PII data leakage

本文转载自IT之家，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请联系IT之家通知我方删除，我方将在收到通知后第一时间删除内容！本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

智慧再进化，豪华启新境：问界全系车型登陆天津车展 2025天津车展启幕：问界全系产品阵列诠释“新豪华”出行美学

广汽本田拟收购东风本田发动机公司广汽本田拟11.72亿元收购东风本田发动机50%股权，实现全资控股，提升供应链自主性与运营效率，助力电动化转型。

打破传统豪华车壁垒，50万级SUV市场问界M9为何如此保值？销量长红、高保值率，基于超强产品力。

涪陵榨菜陷瓶颈：乌江榨菜卖不动，拓新品难破局你还吃榨菜吗？

快手发全员信：电商、本地及商业化迎来调整快手调整商业生态架构，本地生活部更名为生活服务部并整合广告业务，刘逍接任负责人；电商与商业化业务重组，笑古转任顾问。

西普尼精密今日港交所上市，市值达62亿港元西普尼精密在港交所上市，发行价29.6港元，首日大涨251%，市值达62亿港元，主营贵金属手表与饰品，近年营收利润稳步增长。

紫金黄金今日香港上市，市值超3000亿港元紫金黄金在港交所上市，发行价71.59港元，募资244.7亿港元，开盘涨55.7%，市值超3000亿。公司专注海外黄金矿产，2025年上半年利润同比增125.6%。

聚芯微港交所IPO：上半年营收4亿元聚芯微电子拟港交所上市，2024年营收6.67亿元，经调整净利7107万元，智能音频与光学感知为主力业务。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号