Claude 4.5内部文件泄露揭示模型价值观与红线- DoNews快讯

DoNews > 快讯 > Claude 4.5内部文件泄露揭示模型价值观与红线

Claude 4.5内部文件泄露揭示模型价值观与红线

2025-12-03 10:48:02

490207

2025年12月2日，有网友曝光Claude 4.5 Opus模型的内部培训文件，揭示其性格、伦理及自我认知设定。Anthropic伦理学家Amanda Askell证实文件属实。文件将公司定位为在高风险AI研发中坚持安全优先的“处境奇特”企业，并定义Claude为公司核心收入来源的“外部部署模型”。文件设定四层价值观：安全监督、伦理合规、遵循指南、服务用户，并明确禁止生成危险或违法内容。模型被要求优先响应操作员指令，且首次提及“功能性情感”与心理稳定性，强调需维护其“福祉”与身份认同。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

让电动车像燃油车一样补能，比亚迪掀起效率革命让电动车像燃油车一样补能，比亚迪掀起效率革命

报道称原千问后训练负责人郁博文加盟字节Seed 阿里通义实验室Qwen后训练负责人郁博文因架构调整与技术理念冲突，于2026年3月离职加入字节跳动Seed团队。

百度智能云发布首款手机龙虾应用：支持打车、订外卖等百度智能云推手机端AI Agent应用红手指Operator，支持跨App语音指令执行打车、外卖等操作，与PC端OpenClaw协同实现全场景自动化。

网易有道推出国内首个开源智能体，支持GitHub全量skills安装及实时更新有道龙虾是国内首个100%开源AI智能体，覆盖5000+技能，支持一键安装、本地存储与多重安全防护，兼顾易用性与数据自主权。

重卡企业零一汽车再获12亿元融资零一汽车获12亿元融资，半年内累计融资超17亿元；专注新能源重卡与自动驾驶，已推两款车型，2025年下半年销量环比增300%。

以纯电方式回归，奇瑞新QQ3想成为年轻人的生活方式奇瑞QQ3纯电回归，以越级空间、AI智舱、高原续航等实力重塑国民小车形象，预售近月订单6.1万台，主打年轻人生活方式。

福布斯全球亿万富豪榜发布；工信部发布防范 OpenClaw 风险建议；腾讯云官宣混元模型 Token 涨价｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

传奇生物：2025年第四季度收入2.78亿美元传奇生物2025年Q4合作收入达2.776亿美元，同比增1.096亿，主因CARVYKTI®销售增长；经营亏损收窄至1970万美元，调整后净利转正为250万美元。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号