硅谷三巨头AI新品齐发国人团队成中坚力量- DoNews

硅谷AI圈迎来新一轮技术发布高潮。OpenAI时隔6年首次推出开放权重大语言模型gpt-oss-120b和gpt-oss-20b，两个模型均采用Transformer架构并融入MoE设计。gpt-oss-120b总参数1170亿，激活参数51亿；gpt-oss-20b总参数210亿，每token激活36亿参数。模型采用分组多查询注意力机制，组大小为8，以及旋转位置编码（RoPE），原生支持128k上下文。

OpenAI官方称该模型在同体量下达到开源推理模型SOTA水平。gpt-oss-120b在核心推理基准测试中实现与OpenAI o4-mini相近性能，可在单张80GB GPU上高效运行；gpt-oss-20b在常见基准测试中达到与OpenAI o3-mini类似性能，可在仅具16GB内存的端侧运行。模型发布后即有网友在RTX5090上实现每秒160-180tokens的输出速度，并在M4 MacBook上通过3个常用编程能力测试。

谷歌发布文生虚拟世界模型Genie-3，可生成720p清晰度24FPS流畅度的动态世界，实现用户与生成世界的实时交互。该模型需对用户行为实时反馈，且必须符合现实世界物理规律。模型生成的虚拟世界需对物理交互逻辑处理精准，方能实现有效产品化。尽管当前仅停留在官方演示阶段，但其技术突破具有跨时代意义。

Anthropic更新顶（gui）级大模型Claude Opus 4.1，将AI编程能力上限提升2%。该模型当前在AI编程领域保持口碑与市场占有率双料第一，其编程能力提升被视为大模型商业化最彻底的突破方向。

多个产品背后，华人团队持续发挥中坚作用。OpenAI gpt-oss系列模型核心团队包含北大校友任泓宇，其后被Meta重金挖角。OpenAI后训练团队成员、上海交大本科毕业的Wang Xin亦作出重要贡献。谷歌Genie 3团队中，Emma Wang参与服务系统设计优化，实现10倍延迟降低，使模型达到24fps流畅度和亚秒级响应延迟。

此次技术发布被视为硅谷AI圈诸神之战的序幕。OpenAI通过本次发布重新回到开源牌桌，但业界普遍期待后续GPT-5的发布。谷歌通过Genie-3展示其在AI领域的持续投入能力，而Anthropic则通过垂直领域突破保持竞争地位。中国AI力量在此次技术迭代中持续发挥重要作用，业界期待国内企业后续参与这场AI技术盛宴。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。