汤道生对话姚顺雨:腾讯AI下半场,模型和产品如何互相成就?

撰文 | 李信马

题图 | DoNews摄

在入职即将满半年的节点,腾讯AI首席科学家姚顺雨又一次出现在大众视野面前。

6月5日,在2026腾讯云AI产业应用大会上,姚顺雨和腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生同台对话,共同解读AI下半场腾讯的最新布局和思考,并首次回应了腾讯大模型和产品研发深度Co-Design思路。

作为腾讯从OpenAI挖来的顶尖技术大牛,姚顺雨兼任大语言模型部和AI Infra(基础设施)部负责人,在业内被视为腾讯大模型研发和“AI下半场”的技术灵魂。而汤道生自2005年加入腾讯后,先后执掌QQ、广点通、腾讯云等产品,在AI时代又接管了腾讯元宝、QQ浏览器等C端应用,是沉稳的业务操盘手。

他们的对话,更像是在回答“AI怎么造”和“AI怎么用”这两个技术和商业上的核心问题。

智能体正成为重塑生产力的重要引擎。姚顺雨认为,AI的下半场已从寻找方法转向寻找问题,核心在于Foundation(基础模型)、Product(产品)、Frontier(前沿模型)构成的均衡三角。LLM的本质区别在于泛化性,不同场景的数据需相互赋能;而Agent的崛起,让环境、评测与推理行动协同变得比单一模型能力更关键。

汤道生表示,腾讯做 AI 始终坚持以实用、好用、可规模化为目标,而最核心的经验就是扎根场景。真实场景里既有用户需求,也有模型迭代最需要的数据。

下面是这场对话的部分现场实录(经DoNews节选和整理):

汤道生:你认为AI下半场最重要的是什么?

姚顺雨:首先解释一下什么叫做下半场,我最近感觉这个词有点被滥用,这个概念是我去年的一个博客提出来的,什么意思?其实我觉得在去年之前AI已经发展几十年,但是更加重要的是怎么去解决问题,去寻找好的方法。最近我觉得很明显就是方法论已经变得非常成熟,但寻找问题变得更加困难。

举个例子,比如说过去我们发明AlphaGo这样的方法去下围棋,但是这个方法只适合下围棋或者下各种棋类。你会为了翻译做一个特别的模型,但是它只能做翻译,不能做其他事情。

但是有了预训练和后训练之后我们发现,我们像有一个万能锤子,它可以砸任何钉子,它是一个通用方法论,可以解决各种各样的问题,反而更困难的是怎么寻找好的问题去解决。

……

AI下半场最重要是什么?我个人觉得就是,我们应该在中国建立一个长期的基于AGI的组织,今天的AI主要有三部分:

  • 首先是foundation的部分,我们怎么样把预训练和后训练最基础的东西做得非常solid。
  • 第二部分是产品,我们怎么样把这样的技术,真的为人和社会产生价值。
  • 第三个是frontier,我们怎么样探索新的研究范式,探索新的机会。

我觉得最重要的是我们构建一个非常均衡的三角形一样的组织。我觉得对于做foundation来说:

  • 第一,最重要的是有充足资源。
  • 第二,就是需要正确的做事方式,这些和我刚才说的文化也是吻合的。对于产品来说,有好的产品的sense,有这种做产品的人是至关重要的。
  • 第三,在中国我们今天所做的前沿探索不够多,所以我希望能把frontier exploration的精神能更多地注入到我们组织中。

汤道生:你刚刚提到模型跟产品,产品可以说提供一个环境,里面要给模型提供context上下文,我想问一个问题,我们平时开会提的有一个词比较多是Co-Design,怎么把产品和模型能够比较紧密地结合起来,尤其今天有这么多丰富的产品,从我们合作非常紧密的像元宝这样的一个聊天机器人,包括AI搜索,企业里面也有部署智能客服、智能营销,另外最近非常火的类龙虾像CodeBuddy、Workbuddy这样的产品,其实对于模型依赖很深,你怎么思考Co-Design这个方式?

姚顺雨:有三点,首先CoDesign的前提,就是模型本身要做的很solid,有很多foundational的work要做好。我觉得预训练是一个相对就是产品agnostic的事情,它做的非常solid可以提供非常强的foundation,而且预训练它最大的特点就是它是一个可泛化学习过程,它的进步可以带给各种各样下游任务持续的价值提升。后训练我觉得最重要一点是要设立好正确的Eval,中国大家有个不好的倾向是大家喜欢刷榜,但是我觉得更重要的是如何实事求是地基于产品,基于真正的应用,构造更加真实的Eval。

第二,要意识到可能“实用性”价值是大于刷榜价值,这一点我们做了大量工作,跟各种各样产品进行了深度Co-Design,Co-Design很关键一点就是要产生相互信任。怎么取得互信,怎么把产品数据用好,怎么把数据回流,怎么把Eval做好,有很多细节,我就不赘述。

第三点我想说,LLM时代和过去的AI最本质的区别就是泛化性,在LLM之前比如说做翻译产品,只要把翻译数据做得特别好就行了。你做一个围棋的程序,你只需要把围棋的数据准备得特别好就行。但是今天即使你想只做一个Coding Agent,你会发现其实需要的不仅是Coding Agent的数据,你需要非常好的聊天能力,非常强的搜索能力,非常强的指令遵循能力,非常强的推理能力,它其实是非常复合的data的taxonomy,我觉得需要对这个事情有一个taste。

这个事情的推论就是说有很多产品的体系化地方,会有比较大的优势,比如说我们和元宝的Co-Design使我们模型产生很强的聊天和搜索能力,这样的能力又可以被迁移到ima和Workbuddy其他的产品,所以这些产品能够提供不同的数据,但是这些数据之间又可以相互泛化,它形成一个像网络一样的体系,我觉得这一点的价值越来越重要。

姚顺雨:我记得我第一次跟您聊的时候,你跟我讲了很多你过去的经历,从QQ空间、QQ秀,到QQ音乐,到云到现在的元宝,其实跟你聊天很有意思,因为你做过各种各样的产品,to C也有,to B也有,远古时代的也有,最近AI时代的产品也有。我比较好奇,你觉得你做产品的第一性原理是什么,你觉得哪些经验和价值是不变的?哪些东西是变的?

汤道生:我觉得其实最终做产品还是本着用户到底有什么需求,我到底怎么去解决他的痛点,怎么去给用户或者客户创造价值。在不同的时代,甚至不同的行业,你做一个产品还是需要能够给用户带来价值,他才会买单,才会使用。

所以我倒觉得从PC互联网时代我们做空间、移动的时代做各种各样的产品、内容的产品,到产业互联网做云,我们都要花好多的时间、精力去听客户的声音,尝试去帮助他们去解决他的问题,底层的逻辑其实没有这么大的变化。

但确实,我觉得在PC互联网、移动互联网时代做产品跟今天在AI时代做产品还是有蛮多不一样的地方。首先从范式的角度来看,在AI时代以前我们做产品很多时候想的是通过功能来满足用户的需求,你作为一个产品提供方、服务提供方,你想清楚我提供怎么样的一个能力,让用户可能通过某些菜单去选,好像是一些“预制菜”,你只能在里面去点一样。

但在AI时代做产品,它的那种开放式的服务形态就会带来很不一样的要求跟挑战,用简单的交互方式可能是自然语言,可能是语音,其实作为产品方你也不知道用户会问什么。所以要充分利用模型能力去理解用户的需求,然后通过比如说今天大模型的这种逻辑推理,能去调用工具的能力、产品去给模型提供各种各样可以用的工具,来应对这种开放式的需求,这个是我觉得跟我们过去做产品很不一样的地方。

甚至也包括你刚刚提到的Eval,以前我们做产品有很清晰很具体的产品细节功能的描述,怎么去做设计、做研发、做测试,我觉得那个瀑布式的流程也比较清晰。但是做AI产品,我发现最大的变化是我们整个流程可能都要重新设计,尤其今年大部分的代码都由AI生成,我们的工程师可能会花更多的时间去做架构的设计,把写代码的工作都交给AI了,然后定期去指导一下、修正一下。

然后测试也要左移,更前置去想清楚针对我们各种案例Eval、环境,我们对于开放式答案的要求,甚至alignment怎么对齐,我们用户所需要的那种风格,我感觉今天时代做产品其实要求的能力更全面。

姚顺雨:更难了。

汤道生:更难了。我问一下混元3,大家都在说Hy3 preview是你腾讯的首秀,具体混元3做什么改变,你能给大家介绍一下吗?

姚顺雨:其实我觉得没有什么秘密,今天做大模型从某种程度来说是比较Trivial的事情,我们应该把Infrastructure做好,我们应该把数据做好,算法的部分反而是比较简单的。其实我觉得主要几个点吧。

第一,我们把Infrastructure重建了,无论是预训练还是强化学习。第二是我们把数据和Eval做了很大的改变,如何去定义更真实的问题,如何丰富数据的 taxonomy,如何去提高数据的质量,这是一个永无止境的追求。

第三,我觉得很重要的很多决策其实包括怎么去招人,怎么去设立模型的节奏,怎么去每天有很多的Decision 要考虑很多Trade off,我觉得可能没有一个很清晰的公式,我觉得是一个很Taste driven的事情。所以我其实挺好奇问你一个问题的,因为您刚刚跟我讨论Co-Design这个概念,我很好奇您对Co-Design这件事情是怎么想的,你觉得哪些事情是应该模型做的,哪些是产品应该做的?

汤道生:我觉得Co-Design在不同阶段,过去这两年其实是一直在变化的,我觉得这个变化某种程度来讲是随着模型能力的升级而变化,当然整个行业、市场、用户的需求他在变化的过程中也会带来我们两边模型跟产品需要更好去满足。

给我一个比较深的感受是怎么去对齐,因为在我们一起去做产品,去做对齐会的时候,我们有很多不同的决策,产品可能要针对某个方向去解决一些问题,模型到底怎么做去满足这个需求,但是你要回到模型需要数据,数据应该怎么标注,到什么颗粒度,到底什么是好的标注,什么是不好的标注,因为有一些地方要奖励,有一些地方要惩罚。

然后还有Eval,还有评测,因为如果产品认为好的产品体验,评测是不认同的话,大家其实做出来的产品就会不一致了。所以Co-Design给我的感觉更多是在项目组里面不同的角色参与到产品的设计,定了一些产品的目标方向,怎么让多个角色能够对于一些开放式问题有比较好的对齐,如果没有做到这样一个对齐的话,你会发现产品的行为会不可预测。甚至有时候会有一些随机性,因为模型训练的过程可能也被混淆了。所以这是我这两年跟做产品跟模型团队做Co-Design的一个比较深的感受。您觉得呢?

姚顺雨:其实我是觉得,就像我刚刚说的,首先最难的一点是要建立Trust,毕竟我觉得同理心很重要,因为说到底做模型的目标和做产品的目标有很多align的部分,也有很多不align的部分。就是模型的人希望模型能力越强越好,但是产品的人觉得用户需求越满足越好。所以天然有很多不align的部分,我觉得很重要的一点是要有换位思考的能力。

其实就是你刚刚问我元宝是怎么一步一步Co-Design的,一个很重要的细节是,我们当时是派了后训练最强的骨干力量,去帮助元宝把后训练做好。当时我们自己的预训练还没有准备好,但是我们知道维护元宝这样的产品以及它的DAU会对我们接下来做模型也非常非常重要,而且对于创新的合作非常重要。

所以当时其实很多算法同学不理解,我需要去很努力解释,但是现在看起来这些努力都是Trade off,我觉得这样一个动作让产品意识到模型的同学是真的在为产品着想,我觉得这个其实对于我们之后的合作,包括Hy3 preview在元宝上成功上线起到了非常重要的作用。当然有很多技术的部分可以探讨,但是最难的部分反而是怎么样建立信任,怎么样换位思考。

汤道生:技术的发展往往超乎我们的预期。智能体今天大家都说需要消耗很多的Token,这对于混元做下一代模型研发,你觉得什么是你的侧重,有哪些地方比较重要?

姚顺雨:毫无疑问今天Agent或者Coding Agent有点像预训练一样,是不得不做的事情,是最基础能力。我个人觉得Coding Agent有很多本质原因,有一个重要原因就是它是一个有点像图灵完备的事情,当你有能力去控制自己的file system,当你有一个container的时候,其实你是一个完整的系统,今天我觉得Agent毫无疑问是每一家模型所发力的重点,我觉得我们做的方法可能会有几个区别:

第一,即使今天Coding已经是最重要的事情,但是我们还是会强调体系的全面化,我始终认为要把Coding做好,其实需要远远不止Coding的数据,也需要聊天、推理,各种各样不同的东西,因为大模型最重要的点是泛化性。

第二,很显然产品作用越来越重要,如何利用好线上回流,我觉得是一个每个模型厂商都在应对和思考的问题。这里刚刚积累很多CoDesign经验变得非常重要。

第三,我觉得还需要更多想像力,无论是技术演进,还是产品演进,甚至下一个范式演进,我们需要做探索性甚至不确定性的工作。

汤道生:从产品侧,因为大家越来越多有Token焦虑的声音,Token成本爆发式增长,我也听到很多客户甚至用户身边的同事们也在紧盯着积分消耗或者Token消耗,怎么可以让我们的模型在解决某个问题,或者完成某个任务,Token效率更高?我之前做过一些任务可能是不同方向,有些方向也都知道肯定走不下去的,但可能模型还会试,试完之后走不下去再试下一个,里面有什么可以optimize的地方让Token整体使用效率更高?

姚顺雨:我觉得在中国讨论性价比更多是讨论模型架构,但其实它是很复杂的体系,我觉得最重要的是首先是你的performance,很多人跟我说,他最后发现用OPUS这样的模型比用更差的模型更省钱,因为更快的把这个事情做对了,也省得人的精力,最重要的事情是performance,如果你的performance好,性价比是最关键的事情。尤其我觉得今年可能很多简单任务的robustness会变得更加重要,一次把相对简单任务做对,这可能是性价比更关键的部分,不仅是模型架构。

第二部分就是成本它本身,性价比第一是性能,如果性能不好性价比无从谈起。第二点是成本,中国是领先于世界的,就是我们做大量工作优化我们的成本,成本可能最重要的事情是怎么用一个更小的模型把更高的价值任务做好,在这基础上架构创新,包括长文管理有很多需要做的事情。

如果我们做一个相对较小的模型,但是它能比肩大模型性能,而且在大部分任务上做很强的robustness,这可能在很多长程的任务上面有一两个点的提升,可能在今天的中国更有价值。

我很好奇,对于Agent,你是什么时候意识到它是一个新的产品机会,以及你现在的认知是什么,你觉得现在我们第一个好用的Agent bottleneck在哪里呢?

汤道生:我们做的Agent,针对不同场景有不同的产品形态,在Agent设计上面,很大程度是发挥好模型能力,当然模型在迭代,它能力越强,Agent需要做的工作越来越少,我看我们好几个产品在过去这段时间是随着模型能力加强,我们可以把产品,把Agent做得更简化,更多的给模型提供更多不同的工具,创造更多的skills,来让模型能够更高效的去完成任务。

给模型提供更多的我们叫记忆,用户过去使用的一些习惯,我们能提取出来的一些用户preference的信息作为上下文,在Coding环境有相关的context给到模型,在Workbuddy里边办公协作,做个PPT,可能大家关注的内容或者该给到模型的context也会不一样。

所以,在我们做不同的Agent,我觉得更重要的是了解场景下什么内容什么信息是重要的,比较relevant的,能够跟模型配合好,让模型有它需要的信息,同时也发挥它的能力。

我也想再问一下一个可能大家比较多讨论的一个问题,很多人都会提到腾讯慢,说在AI上面我们没有及时抓住一些机会,你觉得我们真的慢了吗?到底下半场是什么?你能再多说一下吗?

姚顺雨:我觉得首先AI其实今天有两个重要判断,第一个就是说我们认为AI是一个短期的游戏还是长期游戏?在硅谷大家蔓延很多情绪,哎呀,几年后所有人都要失业,AI要取代所有人的工作,我们要赶快赚两年钱退休。但很显然我们的判断AI是一个长期游戏,其实我觉得AI刚开始,下半场才刚刚开始,我不认为ChatGPT和Claude Code会是唯一的super App,我觉得那是一个非常灰暗的世界,我觉得肯定会有源源不断新的机会诞生。

可能今天就像是70年代PC刚刚产生的时候,我觉得还有很多很多事情需要做。

第二个判断,它会是个更线性还是多元游戏?因为确实过去几年大家能看到的是Pre-training、post training,然后Agent,Coding Agent,似乎有一个非常清晰的主线,这个主线是所有人都在做一样的事情,都在copy,这也是非常灰暗的事情。

但到底未来变得更单一还是更多元?我个人看法会变得更多元,毫无疑问Coding Agent生产力会变得更加重要,我觉得它是刚刚开始的事情,这个世界还有很多空间没有被填满,多模态、具身智能,很多很多新的事情都在发生,或者刚刚发生,所以从这个角度来说,如果我们认为下半场刚刚开始,可能确实不是完了。

过去模型、产品做了很多探索,走很多弯路,我觉得这是正常的,你如果没有做过一个事情,第一次做肯定有曲折,但是我觉得可能更重要的事情是能不能诚实面对自己,能不能Be Real,能不能够去看到feedback然后去改变,能不能够保持耐心,这个事情是下半场最重要的事情。

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号