GPT-5发布后遭差评 OpenAI发布指南解释交互方式变革- DoNews

自8月8日GPT-5正式发布以来，产品口碑持续低迷，用户吐槽不断。

GPT-5在发布前被宣传为具备博士水平智能的AI产品，官方自信地下架了旧模型，声称GPT-5可“吊打一切”。

但仅几天后，由于用户使用体验不佳，官方被迫恢复旧版模型。

尽管从测试和跑分来看，GPT-5具备明显技术优势，特别是在数学、真实世界编码、多模态理解和健康领域。

评测人员指出，GPT-5是典型的“理科生”，在科学和技术任务上表现出色，能解数学难题、编写复杂代码。

但GPT-5的稳定性存在问题，有时会在简单问题上出错，在涉及人类情感的任务上表现冷漠，创意能力未见明显提升。

其“情商”下降成为用户最难以接受的方面，导致实用性受到质疑。

发布后72小时内，OpenAI收到大量退订请求。

官方随后发布提示词指南，解释用户与AI的交互方式已发生改变。

指南指出，GPT-5已进化为具备自主规划和深度思考能力的“数字心智”，旧交互方式失效。

核心变化包括智能体任务性能、编码能力、原始智能和可引导性。

GPT-5能够理解复杂目标并自主完成任务，编程能力堪比全栈工程师。

其对指令敏感，可通过Responses API保留上下文，减少重复输入。

官方数据显示，GPT-5在Tau-Bench测试中分数由73.9%提升至78.2%。

该模型的双刃剑效应明显，使用得当可实现博士级智能，使用不当则沦为“人工智障”。

OpenAI提出“智能体急切性”概念，强调用户需掌握引导AI的技巧。

指南提供多个使用场景及优化策略，如控制推理强度、设定停止标准、限制工具调用等。

用户可设定“红绿灯”机制，控制AI思考深度和输出长度。

对于复杂任务，建议提高推理强度并赋予AI更多自主权。

指南建议用户让AI定期汇报工作，以结构化方式呈现进度。

在应用开发中，建议引导AI先进行架构设计，再执行编码。

针对项目重构，建议提供详尽规则以保持风格一致性。

用户反馈显示，GPT-5有时生成内容过于冗长或简略。

解决方案包括调整全局参数verbosity和优化提示词。

指南强调，GPT-5对指令冲突更敏感，需避免提示词中出现矛盾。

解决方法包括审查提示词、设定指令优先级、使用官方工具检测问题。

极速模式适用于低延迟场景，但需用户优化提示词质量。

元提示（Metaprompting）可用于让AI优化用户提示词。

指南揭示GPT-5差评原因在于交互方式发生重大变化。

多数用户尚未适应新模型的复杂性。

OpenAI指出，与AI协作的核心在于认知升级，而非单纯依赖指令。

未来AI模型智能化程度将持续提升，用户需转变与工具交互的思维模式。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。