硅谷AI圈迎来新一轮技术发布高潮。OpenAI时隔6年首次推出开放权重大语言模型gpt-oss-120b和gpt-oss-20b,两个模型均采用Transformer架构并融入MoE设计。gpt-oss-120b总参数1170亿,激活参数51亿;gpt-oss-20b总参数210亿,每token激活36亿参数。模型采用分组多查询注意力机制,组大小为8,以及旋转位置编码(RoPE),原生支持128k上下文。
OpenAI官方称该模型在同体量下达到开源推理模型SOTA水平。gpt-oss-120b在核心推理基准测试中实现与OpenAI o4-mini相近性能,可在单张80GB GPU上高效运行;gpt-oss-20b在常见基准测试中达到与OpenAI o3-mini类似性能,可在仅具16GB内存的端侧运行。模型发布后即有网友在RTX5090上实现每秒160-180tokens的输出速度,并在M4 MacBook上通过3个常用编程能力测试。
谷歌发布文生虚拟世界模型Genie-3,可生成720p清晰度24FPS流畅度的动态世界,实现用户与生成世界的实时交互。该模型需对用户行为实时反馈,且必须符合现实世界物理规律。模型生成的虚拟世界需对物理交互逻辑处理精准,方能实现有效产品化。尽管当前仅停留在官方演示阶段,但其技术突破具有跨时代意义。
Anthropic更新顶(gui)级大模型Claude Opus 4.1,将AI编程能力上限提升2%。该模型当前在AI编程领域保持口碑与市场占有率双料第一,其编程能力提升被视为大模型商业化最彻底的突破方向。
多个产品背后,华人团队持续发挥中坚作用。OpenAI gpt-oss系列模型核心团队包含北大校友任泓宇,其后被Meta重金挖角。OpenAI后训练团队成员、上海交大本科毕业的Wang Xin亦作出重要贡献。谷歌Genie 3团队中,Emma Wang参与服务系统设计优化,实现10倍延迟降低,使模型达到24fps流畅度和亚秒级响应延迟。
此次技术发布被视为硅谷AI圈诸神之战的序幕。OpenAI通过本次发布重新回到开源牌桌,但业界普遍期待后续GPT-5的发布。谷歌通过Genie-3展示其在AI领域的持续投入能力,而Anthropic则通过垂直领域突破保持竞争地位。中国AI力量在此次技术迭代中持续发挥重要作用,业界期待国内企业后续参与这场AI技术盛宴。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。