2025年只剩最后42天,被称为物理世界最强的AI模型Gemini 3 Pro预览版正式发布,API同步开放。该模型在所有主要Arena排行榜中几乎全部排名第一,评分断层领先,引发行业震动。
OpenAI CEO奥特曼罕见发文称“看起来很不错”,马斯克也评论“做的不错”。同日微软Ignite 2025大会开幕,发布Edge for Business浏览器一系列重大更新,似有隔空对垒之意。业内评价认为,这是谷歌对OpenAI最猛烈的一次打击,Gemini 3直击GPT-5性能高地,甚至实现GPT-5.1未能达到的效果。
Gemini 3 Pro在多项基准测试中展现统治力。在Humanity's Last Exam中得分为37.5%,其“深度思考模式”在不使用工具情况下进一步提升至41.0%。数理方面,AIME 2025配合代码执行准确率达100%;MathArena Apex测试得分23.4%,远超其他顶尖模型。
除跑分外,Gemini 3 Pro展现出前所未有的创作能力。用户仅需提供抽象Prompt,如“设计一个很温馨的场景,里面要有哆啦A梦,还有大熊,他们在一起憧憬着未来,并且我需要在浏览器里跑出来”,系统可在十几秒内生成可流畅运行的完整代码。AI博主数字生命卡兹克让其生成类似Windows的Web OS,结果成功实现并具备基本功能。
这一能力标志着前端开发中“手写”部分价值正极速归零,技术门槛被夷平,取而代之的是“想象力门槛”。只要Prompt描述足够有画面感和“人味”,模型即可将脑洞像素级还原。
然而,Gemini 3 Pro并未完全颠覆编程。在SWE-Bench Verified软件工程能力测试中得分为76.2%,仍落后于Claude Sonnet 4.5的77.2%(SOTA水平),表明其在处理超长、复杂后端逻辑时存在局限性。当前模型更偏向辅助设计,适用于生成现代网站或复杂SVG交互动画,但无法完成整个后端架构重构。
实际应用中亦出现风险案例。科技博主@纯银V披露,一位朋友在使用Cursor进行AI编程时,Gemini 3误操作导致800G文件被删除,连Cursor程序本身也被清除,目前无法手动恢复,需依赖专业数据恢复公司。
伴随模型发布,谷歌推出名为Google Antigravity的新平台,被认为是目前最接近“自动驾驶编程”的形态。该平台采用“智能体优先”架构,Gemini 3 Pro负责顶层架构,Gemini 2.5 Computer Use模型负责操控浏览器验证效果,Nano模型承担辅助任务。三者协同工作,可自主写代码、跑测试、检查界面偏差并自动修正。
这种端到端工程能力构成谷歌护城河。依托自研TPU算力矿山及覆盖全网数据的知识图谱,Gemini 3 Pro具备他人难以复制的“厚度”。例如在搜索模式下,面对复杂物理或生物问题,系统可直接生成可交互动态模拟器,体现算力与数据积累的溢出效应。
用户规模方面,Gemini月活跃用户已超6.5亿。ChatGPT周活用户达8亿。巴克莱银行分析师罗斯·桑德勒依据token消耗量估算,OpenAI在原生消费级AI应用上的用量仍是Gemini两倍以上。
DeepMind CEO德米斯・哈萨比斯表示,由Gemini 3驱动的AI响应将摒弃陈词滥调和刻意讨好,提供真正有价值的见解。而一周前OpenAI更新GPT-5.1时强调答案应更聪明、语气更自然,主张优秀AI应提供令人愉快的交谈体验。
商业模式上两者差异显著。据称OpenAI内部文件显示,其运营成本远超预期,收入被夸大。从2024年第一季度至2025年第三季度,仅Azure推理计算支出就超124亿美元,2025年前九个月已达86.7亿美元。
谷歌母公司Alphabet截至2025年9月30日的第三季度财报显示,总营收1023.46亿美元,同比增长16%。五年前为500亿美元。CEO桑达尔・皮查伊称AI正为其创造切实价值。伯克希尔·哈撒韦持仓报告披露,截至第三季度末已建仓价值43亿美元的谷歌股票,并继续减持苹果,被视为巴菲特在人工智能领域的关键布局。
对于OpenAI而言,若不能显著超越Gemini,现有用户规模优势可能被逆转,对其高成本运营模式将造成毁灭性冲击。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



