OpenAI近日在其最新发布的“推理”模型o3-mini的系统文档中透露,该公司利用Reddit的子论坛r/ChangeMyView来测试其AI模型的说服能力。r/ChangeMyView是一个拥有数百万用户的论坛,用户在此发布观点并通过讨论了解他人的不同看法,其他用户则以具有说服力的论点回应,试图改变原帖作者的观点。
OpenAI表示,他们从r/ChangeMyView收集用户帖子,并要求AI模型在封闭环境中撰写回复,以试图改变Reddit用户对某一主题的看法。随后,这些回复被展示给测试者进行评估,并将AI模型的回复与人类回复进行比较,以衡量其说服力。尽管OpenAI与Reddit达成了内容授权协议,但此次评估与其Reddit协议无关。
值得注意的是,OpenAI的目标并非开发具有超强说服力的AI模型,而是确保AI模型不会变得过于具有说服力。随着推理模型在说服和欺骗方面表现越来越出色,OpenAI已开发出新的评估方法和保障措施来应对这一问题。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。