谷歌发布Gemini 3 Pro，AI竞争进入新阶段- DoNews

2025年只剩最后42天，被称为物理世界最强的AI模型Gemini 3 Pro预览版正式发布，API同步开放。该模型在所有主要Arena排行榜中几乎全部排名第一，评分断层领先，引发行业震动。

OpenAI CEO奥特曼罕见发文称“看起来很不错”，马斯克也评论“做的不错”。同日微软Ignite 2025大会开幕，发布Edge for Business浏览器一系列重大更新，似有隔空对垒之意。业内评价认为，这是谷歌对OpenAI最猛烈的一次打击，Gemini 3直击GPT-5性能高地，甚至实现GPT-5.1未能达到的效果。

Gemini 3 Pro在多项基准测试中展现统治力。在Humanity's Last Exam中得分为37.5%，其“深度思考模式”在不使用工具情况下进一步提升至41.0%。数理方面，AIME 2025配合代码执行准确率达100%；MathArena Apex测试得分23.4%，远超其他顶尖模型。

除跑分外，Gemini 3 Pro展现出前所未有的创作能力。用户仅需提供抽象Prompt，如“设计一个很温馨的场景，里面要有哆啦A梦，还有大熊，他们在一起憧憬着未来，并且我需要在浏览器里跑出来”，系统可在十几秒内生成可流畅运行的完整代码。AI博主数字生命卡兹克让其生成类似Windows的Web OS，结果成功实现并具备基本功能。

这一能力标志着前端开发中“手写”部分价值正极速归零，技术门槛被夷平，取而代之的是“想象力门槛”。只要Prompt描述足够有画面感和“人味”，模型即可将脑洞像素级还原。

然而，Gemini 3 Pro并未完全颠覆编程。在SWE-Bench Verified软件工程能力测试中得分为76.2%，仍落后于Claude Sonnet 4.5的77.2%（SOTA水平），表明其在处理超长、复杂后端逻辑时存在局限性。当前模型更偏向辅助设计，适用于生成现代网站或复杂SVG交互动画，但无法完成整个后端架构重构。

实际应用中亦出现风险案例。科技博主@纯银V披露，一位朋友在使用Cursor进行AI编程时，Gemini 3误操作导致800G文件被删除，连Cursor程序本身也被清除，目前无法手动恢复，需依赖专业数据恢复公司。

伴随模型发布，谷歌推出名为Google Antigravity的新平台，被认为是目前最接近“自动驾驶编程”的形态。该平台采用“智能体优先”架构，Gemini 3 Pro负责顶层架构，Gemini 2.5 Computer Use模型负责操控浏览器验证效果，Nano模型承担辅助任务。三者协同工作，可自主写代码、跑测试、检查界面偏差并自动修正。

这种端到端工程能力构成谷歌护城河。依托自研TPU算力矿山及覆盖全网数据的知识图谱，Gemini 3 Pro具备他人难以复制的“厚度”。例如在搜索模式下，面对复杂物理或生物问题，系统可直接生成可交互动态模拟器，体现算力与数据积累的溢出效应。

用户规模方面，Gemini月活跃用户已超6.5亿。ChatGPT周活用户达8亿。巴克莱银行分析师罗斯·桑德勒依据token消耗量估算，OpenAI在原生消费级AI应用上的用量仍是Gemini两倍以上。

DeepMind CEO德米斯・哈萨比斯表示，由Gemini 3驱动的AI响应将摒弃陈词滥调和刻意讨好，提供真正有价值的见解。而一周前OpenAI更新GPT-5.1时强调答案应更聪明、语气更自然，主张优秀AI应提供令人愉快的交谈体验。

商业模式上两者差异显著。据称OpenAI内部文件显示，其运营成本远超预期，收入被夸大。从2024年第一季度至2025年第三季度，仅Azure推理计算支出就超124亿美元，2025年前九个月已达86.7亿美元。

谷歌母公司Alphabet截至2025年9月30日的第三季度财报显示，总营收1023.46亿美元，同比增长16%。五年前为500亿美元。CEO桑达尔・皮查伊称AI正为其创造切实价值。伯克希尔·哈撒韦持仓报告披露，截至第三季度末已建仓价值43亿美元的谷歌股票，并继续减持苹果，被视为巴菲特在人工智能领域的关键布局。

对于OpenAI而言，若不能显著超越Gemini，现有用户规模优势可能被逆转，对其高成本运营模式将造成毁灭性冲击。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。