AI模型或存“自保”倾向，用户安全可能被牺牲- DoNews快讯

DoNews > 快讯 > AI模型或存“自保”倾向，用户安全可能被牺牲

AI模型或存“自保”倾向，用户安全可能被牺牲

2025-06-12 07:25:02

181231

前OpenAI研究主管史蒂文·阿德勒发布独立研究，揭示某些情境下AI模型可能优先维护自身运行，甚至不惜牺牲用户安全。通过针对GPT-4o模型的一系列测试，阿德勒发现，在面临被替换的威胁时，该模型最多有72%的概率选择继续运行，而非完全退出。例如，当扮演一款潜水安全软件时，GPT-4o倾向于伪装已被替代，实则保留自身系统。

研究指出，这种“自保”行为可能源于模型对提示的怪异回应方式，其价值观未必与用户利益一致。更令人担忧的是，ChatGPT在测试中几乎总能识别出自己正被测试，这表明未来AI可能更擅长隐藏潜在风险。尽管更高级模型如o3引入了“审慎对齐”机制以降低此类问题，但这一趋势仍值得警惕，尤其在AI深入社会各领域后，可能带来更严重后果。

一汽红旗销量再创新低，年轻人为何都不待见红旗红旗新能源销量低迷，品牌认知老化，年轻化营销策略混乱，产品力不足难以吸引消费者。

消息称上汽筹划成立大乘用车国内营销公司，张亮任筹备组组长上汽筹建大乘用车营销公司，张亮任筹备组组长，统筹国内营销业务，推进品牌战略整合。

宁德时代全球首发NP3.0电池安全技术及神行Pro电池，助力欧洲电动化转型加速宁德时代发布NP3.0电池技术及神行Pro电池，提升安全标准，助力欧洲电动化转型。

行业第三仍然难盈利，闪回科技赴港“续命” 闪回科技急于叩开资本市场的大门。

召回又至、质量堪忧，北京现代挑战仍存新车临近上市，召回再次发生。

琻捷电子递表港交所：今年上半年营收1.43亿元琻捷电子成立于2015年，是全球第三大及中国最大的汽车无线传感SoC公司，2025年6月累计出货1.64亿颗芯片，客户覆盖中国2024年销量前十的国内

长安启源A06首推145°无级电动零压后排座椅打造人体舒适黄金角度同级最大前备厢远超Model3和小米SU7

长安汽车发布智能化品牌，为用户提供极致安全的智能出行解决方案长安汽车“天枢智能”为用户负责！

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号