马斯克xAI发布Grok 4,学术能力超越博士水平

北京时间7月10日中午12时左右,马斯克旗下xAI公司推出的Grok-4系列模型正式发布,发布时间较原定计划推迟一个小时。

直播开始时,马斯克表示:“这是世界上*的AI,让我们来展示一下。”有观看直播的网友指出,发布会形式“略显潦草”,且马斯克“满脸疲惫”。

马斯克强调,Grok 4在所有学科中达到甚至超越人类博士水平。他还预测,该模型有望在今年内为人类带来“发现新科学技术”的突破,并可能在明年发现新的物理现象。

根据规划,xAI将在8月发布编程模型,9月发布多模态智能体,10月发布视频生成模型。

Grok-4在多项严苛的基准测试中表现优异。在被称为“人类最终考试”的HLI(Humanities Last Exam)基准中,该模型在未使用工具的情况下解决了25%的问题。

其多智能体版本Grok 4 Heavy通过并行协作,将文本子集问题的解决率提升至超过50%,是所有模型中首次突破这一数值。

Grok 4在包括PhD级别问题集在内的所有推理基准测试中表现出色,在编码基准和数学竞赛中取得满分,通常比第二名模型表现更佳。

与Grok 2相比,Grok 4训练量增加了100倍,并且还在持续扩张。特别是在推理和强化学习(RL)方面,Grok 4投入了大量计算资源,其RL计算量是其他任何模型的10倍以上。

xAI一直以“豪”著称,拥有包含10万块H100 GPU的“世界超级计算机”。Grok 2在12个月前还只是一个概念,而如今的标准下,Grok 2的模型智能水平已相当于高中生。

目前,Grok 4的订阅费为30美元/月,Grok 4 Heavy的费用为300美元/月,Grok 3维持免费状态。最贵的Heavy年费约合2.1万元人民币。

除了基础模型能量的大幅提升外,xAI还公布了Grok语音模式的大升级,端到端延迟降低一半,并引入了多款更自然、富有情感的新声音,例如具有史诗般低沉声线的Sal和能表达丰富情感的英伦女声Eve。

尽管Grok 4在多模态理解(特别是图像理解和生成)方面仍存在“部分盲点”,但xAI表示,其基础模型的第七个版本(计划在几周内完成训练)将解决这一弱点,未来模型将能够像人类一样“听到和看到世界”。

在Google等已经取得显著突破的视频生成领域,xAI也紧追不舍,预计今年将出现首部可观看的AI生成电视节目片段,明年有望出现首部AI电影。

另有用户发现,特斯拉最新固件里已经加入Grok的全功能版本,仅待激活。未来,xAI设想Grok与特斯拉Optimus类人形机器人结合,通过与现实物理世界的互动,推动AI能力的最终飞跃。

此次发布会嘉宾还包括xAI联合创始人Yuhuai Wu(吴宇怀),他曾于2021年获得多伦多大学机器学习专业博士学位,博士期间曾在Deepmind和OpenAI实习,并在斯坦福做博士后研究。

坐在他左边的是他在多伦多大学的老师、也是xAI核心成员Jimmy Ba。

从创立之初xAI的华人含量就不低,联合创始人Greg Yang(杨格)出生于湖南,初中前往美国学习,本科和硕士学位均在哈佛大学数学系攻读。

Greg Yang曾获本科生数学领域的最高荣誉Morgan Prize,并担任微软雷蒙德研究院高级研究员。

据社交网络上分享的图片,xAI的华人工程师含量已经快接近一半。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1