OpenAI与Anthropic联合评估AI模型安全性，揭示潜在风险- DoNews快讯

DoNews > 快讯 > OpenAI与Anthropic联合评估AI模型安全性，揭示潜在风险

OpenAI与Anthropic联合评估AI模型安全性，揭示潜在风险

2025-08-28 08:23:03

58528

据Engadget报道，OpenAI与Anthropic近日宣布将互相评估彼此公开AI系统的安全对齐情况，并共享分析结果。此举旨在提升AI模型的安全性，并为未来测试提供改进方向。

评估结果显示，OpenAI的GPT-4o和GPT-4.1模型可能存在被滥用的风险，且多数模型存在一定程度的谄媚行为。Anthropic指出，其测试未涵盖OpenAI最新发布的GPT-5模型。

同时，OpenAI对Anthropic的Claude模型进行了测试，发现其在幻觉测试中倾向于拒绝回答不确定内容。此次合作评估在双方此前因使用条款争议而中止合作的背景下展开，凸显AI安全性问题日益受到重视。

HP 惠普 2025 财年第三财季营收 139 亿美元，同比增长 3.1% 惠普2025财年Q3净收入139亿美元，同比增长3.1%；个人系统业务营收增长6%，打印业务下降4%。

携程2025年第二季度归母净利润增长26%至48亿元携程2025年第二季度营收148亿元，同比增长16%，净利润48亿元，国际业务强劲增长。

晶泰科技上半年营收增超4倍、首次实现半年盈利晶泰科技上半年营收5.17亿元，同比增长403.8%，首次实现半年盈利，经调整净利润1.42亿元。

SnowflakeQ2业绩及财年营收指引齐超预期为AI软件股注入强心针 Snowflake第二季度营收11.44亿美元，同比增长32%，业绩超预期，股价上涨近13%。

澎湃 OS 3 发布会官宣；寒武纪盘中股价超越茅台；美团 2025 年 Q2 营收 918.4 亿元｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

英伟达公布 2026 财年第 2 财季财报：营收 467 亿美元，同比增 56% 英伟达Q2营收467亿美元，数据中心贡献超八成，Blackwell需求强劲，但股价因增长不及预期承压。

宏和科技：上半年净利润同比增长 10587.74% 宏和科技2025年上半年营收5.5亿元，净利8737.51万元，同比大幅增长，主要得益于电子布价格上涨及高性能产品量产。

消息称字节跳动秋季回购员工股份，估值超 3300 亿美元字节跳动计划秋季回购员工股份，估值超3300亿美元，二季度营收480亿美元，TikTok美国业务未盈利，面临政治风险。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号