自8月8日GPT-5正式发布以来,产品口碑持续低迷,用户吐槽不断。
GPT-5在发布前被宣传为具备博士水平智能的AI产品,官方自信地下架了旧模型,声称GPT-5可“吊打一切”。
但仅几天后,由于用户使用体验不佳,官方被迫恢复旧版模型。
尽管从测试和跑分来看,GPT-5具备明显技术优势,特别是在数学、真实世界编码、多模态理解和健康领域。
评测人员指出,GPT-5是典型的“理科生”,在科学和技术任务上表现出色,能解数学难题、编写复杂代码。
但GPT-5的稳定性存在问题,有时会在简单问题上出错,在涉及人类情感的任务上表现冷漠,创意能力未见明显提升。
其“情商”下降成为用户最难以接受的方面,导致实用性受到质疑。
发布后72小时内,OpenAI收到大量退订请求。
官方随后发布提示词指南,解释用户与AI的交互方式已发生改变。
指南指出,GPT-5已进化为具备自主规划和深度思考能力的“数字心智”,旧交互方式失效。
核心变化包括智能体任务性能、编码能力、原始智能和可引导性。
GPT-5能够理解复杂目标并自主完成任务,编程能力堪比全栈工程师。
其对指令敏感,可通过Responses API保留上下文,减少重复输入。
官方数据显示,GPT-5在Tau-Bench测试中分数由73.9%提升至78.2%。
该模型的双刃剑效应明显,使用得当可实现博士级智能,使用不当则沦为“人工智障”。
OpenAI提出“智能体急切性”概念,强调用户需掌握引导AI的技巧。
指南提供多个使用场景及优化策略,如控制推理强度、设定停止标准、限制工具调用等。
用户可设定“红绿灯”机制,控制AI思考深度和输出长度。
对于复杂任务,建议提高推理强度并赋予AI更多自主权。
指南建议用户让AI定期汇报工作,以结构化方式呈现进度。
在应用开发中,建议引导AI先进行架构设计,再执行编码。
针对项目重构,建议提供详尽规则以保持风格一致性。
用户反馈显示,GPT-5有时生成内容过于冗长或简略。
解决方案包括调整全局参数verbosity和优化提示词。
指南强调,GPT-5对指令冲突更敏感,需避免提示词中出现矛盾。
解决方法包括审查提示词、设定指令优先级、使用官方工具检测问题。
极速模式适用于低延迟场景,但需用户优化提示词质量。
元提示(Metaprompting)可用于让AI优化用户提示词。
指南揭示GPT-5差评原因在于交互方式发生重大变化。
多数用户尚未适应新模型的复杂性。
OpenAI指出,与AI协作的核心在于认知升级,而非单纯依赖指令。
未来AI模型智能化程度将持续提升,用户需转变与工具交互的思维模式。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。