12月18日上海的暖意,似乎也延伸到了世博中心。五千多人的会场座无虚席,但与两年前的躁动不同,今年这里弥漫着一种深思熟虑后的从容。
这种变化,是行业走向成熟的标志。两年前,大家讨论的是“奇点临近”、“AGI的想象力”。而今年,过道里、展台前,大家高频交流的关键词变成了:“商业落地”、“推理成本”、“业务价值”。
当技术的光环逐渐融入产业的肌理,行业终于从概念的狂欢走向了务实的耕耘,核心议题回归到了两个字:价值。
就在这种务实求真的氛围里,火山引擎公布了一个极具分量的数据:日均调用量50万亿Tokens。
外行看热闹,看到的是指数级的增长。内行看门道,这其实是技术红利释放后的“普惠”。当Tokens变得像自来水一样触手可及且供给充足时,意味着大模型终于完成了从“高科技奢侈品”到“工业基础设施”的华丽转身。它不再是橱窗里昂贵的展品,它变成了支撑万丈高楼的坚实底座。
但比起这个宏大的数字,我在会场的角落里,看到了另一个关于软件开发范式变迁的细节,可能比50万亿这个数字更具深远的意义,那就是代码量缩减96%。
这不仅仅是效率的飞跃,更是对开发者角色的全新赋能。站在2025年的尾巴上,我们观察到:以APP为中心的移动互联网范式,正在被以Agent为中心的智能交互范式所补充和拓展。
这场重构的主题只有八个字:大模型普惠,Agent重构。
普惠基建:推理经济学的胜利
过去两年,企业的目光往往聚焦在“训练”上。那个时候,大家更关注模型参数的规模,关注基座能力的上限,甚至不少企业投入重金,希望通过自建模型来构建技术壁垒。
但到了2025年底,这种观念开始升级。随着基座模型能力的日益强大和标准化,企业发现:如何以最优成本、最高效率让模型在业务中跑起来,才是新的决胜点。
火山引擎智能算法负责人吴迪在大会主论坛的一席话,道出了行业的风向标。他指出,对于大部分团队来说,构建低成本、高吞吐的推理服务,其价值和难度甚至超过了模型训练本身。
这是一个非常深刻的产业洞察。训练是集中式的攻坚战,是一次性的高投入。而推理是碎片化的、全天候的长跑,考验的是耐力和精细化运营能力。
当豆包大模型的日均调用量冲到50万亿时,它实际上是在展示一家云厂商的极致调度能力。企业如果选择自建推理集群,往往需要面对“高吞吐、低延迟、低成本”这个著名的“不可能三角”。
试想一下,一家电商企业为了迎接AI浪潮自建了集群。平时流量平稳时,硬件资源可能存在闲置。可一旦遇到大促流量洪峰,系统的弹性扩容能力又面临巨大挑战,稍有不慎就会影响用户体验。更不用说随着模型架构的快速迭代,维护这套系统需要投入大量的专业SRE人才和持续的软硬件适配成本。
火山引擎给出的解法极其务实且高效,他们选择做AI时代的“电力公司”,提供极致的推理服务。在Force大会现场,我们看到了这种算力经济学的具象化展示。通过vLLM的深度优化、异构计算的智能调度以及软硬一体化的极致压榨,火山引擎将推理成本优化到了极致。其推出的AI节省计划,更是实打实地帮助企业降低了近一半的成本。
IDC的数据显示,中国公有云上每两个Tokens,就有一个来自火山引擎。这说明算力正在经历“基础设施化时刻”。
未来的AI行业格局会更加清晰:极少数像火山引擎这样的超级节点,通过底层技术突破物理极限,提供像水电一样稳定、便宜的基础设施。而海量的应用开发者,不再需要被底层架构的复杂性所困扰,不需要精通CUDA编程,只需要专注于业务逻辑本身。
这是AI从实验室走向产业深处的必经之路,也是技术普惠的最大红利。
96%代码缩减:重塑创造力
如果说算力基础设施化改变了B端的成本结构,那么AgentKit的出现则重塑了C端的开发体验,是对软件工程的一次“升维赋能”。
火山引擎总裁谭待展示的数据非常振奋人心:开发同一个具备复杂功能的Agent,原先可能需要1500行代码,现在只需要不到70行。
我们要意识到,这减少的96%代码,并不是简单的省略,而是对复杂度的封装与抽象。在传统的软件工程里,开发者需要花费大量精力去处理状态管理、记忆存储、API调用、鉴权机制等中间件逻辑。
现在,AgentKit将这些通用能力内化为了模型的“本能”。
首先是记忆能力的自动化。过去,为了让助手记住用户的偏好,开发者需要设计复杂的数据库结构。现在,AgentKit自带“海马体”,模型能自动管理长短期记忆,像人一样自然地记住交互历史,让开发者从繁琐的数据读写中解脱出来。
其次是工具调用的智能化。过去,对接外部API需要编写大量的适配代码。现在,大模型可以像人类使用工具一样,通过阅读标准化的描述文档,智能地调用外部系统,极大地降低了系统集成的门槛。
最后是交互逻辑的灵动化。过去,业务流程往往是固定的。现在,模型通过意图识别能自动规划路径,灵活应对用户的个性化需求。
这意味着“实现功能”的门槛降低了,但“创造价值”的天花板被打开了。
对于“科技不许冷”的读者,尤其是技术人员而言,这是一个激动人心的变化。这并不意味着开发者角色的弱化,反而是价值的跃迁。竞争的维度将从谁的代码写得更熟练,转向谁对业务场景的理解更深刻、谁的架构设计更精妙。
未来的软件开发,将不再是重复造轮子,而是对业务目标与逻辑流程的顶层设计。
这种变化带来了巨大的机遇。当一个懂业务的销售主管,能用不到70行的代码构建出一个具备长期记忆、能熟练调用企业ERP系统的智能体时,企业的创新活力将被彻底激发。我们不再局限于一个个孤立的APP,而是构建起能够穿梭在各种数据孤岛之间、高效协作的Agent网络。
根据火山引擎分享的数据,2024年一个企业内部可能只有50多个简单的Agent,但到了2025年,这个数字已经增长到了200多个。它们就像是新时代的数字员工,听得懂人话,且高效专业。Agent正在成为企业数字化转型的核心载体,让开发者能够聚焦于最具创造性的工作。
多模态:从Demo到生产力
多模态技术一直是行业的焦点,而直到2025年底,我们欣喜地看到它真正具备了“生产级”的能力。
之前的多模态技术多处于探索期,而这次发布的Seedance 1.5 pro和豆包1.8,标志着技术开始全面服务于严肃的商业流程,解决了“可用性”和“可控性”的关键难题。
Seedance 1.5 pro攻克了视频生成领域极具挑战的音画同步难题。在现场演示中,视频人物在四川话和西班牙语之间无缝切换,口型完美匹配。这种流畅自然的表现,意味着内容生产效率的质变。
这对于企业来说是巨大的利好。出海企业不再需要为每个语种单独拍摄素材,只需一段文本,就能生成几十种语言的本地化营销视频,极大地提升了全球化营销的效率。泛娱乐行业也能更高效地生成高质量的虚拟互动内容,打造出能面对面聊天、表情生动、口型精准的虚拟伙伴。
豆包1.8则把单次视频理解帧数翻倍到了1280帧。这意味着AI拥有了“长视频深度理解能力”。
以前的AI只能捕捉片段,而现在的豆包1.8能理解整集电视剧、整场会议视频的连贯逻辑。在通用智能体测评集BrowserComp上,豆包1.8的表现全球领先。
试想一下,在未来的产品质检流水线上,AI不再是简单比对,而是像经验丰富的质检员一样,关注长达数小时的监控视频,精准识别出那一秒的操作偏差。这才是多模态AI真正的产业价值——让AI具备“时间维度的感知力”和“真实的表达力”。
当AI能听懂、能看懂、能表达时,人机交互的界面就从屏幕延展到了我们身处的环境本身。这不仅是体验的升级,更是生产力的全面释放。
信任闭环:护航核心业务
数据规模炸裂,工具能力进化,但企业在拥抱AI时,依然将安全视为重中之重。
企业端的理性在于,他们引入AI不是为了赶时髦,而是为了极其务实的降本增效。像比亚迪、中石油、海底捞这些行业巨头,都在积极利用AI重构业务流程。
以中国石油勘探开发研究院为例,他们利用火山安全运营智能体,实现了对海量安全告警的AI自动化值守。结果显示,无效告警被智能过滤了八成以上,运营效率提升了10倍。
这些成功案例的背后,是安全信任机制的有力支撑。火山引擎此次重点强调的机密计算技术,正是为了打通企业上云的“信任闭环”。
机密计算建立了一个高标准的加密环境,数据在传输、存储甚至计算的全生命周期中都处于加密保护之下,就像是一个坚不可摧的保险箱,连云厂商自己都无法窥探客户的数据内容。这实现了真正的数据“可用不可见”。
这道信任基石的建立,让Agent不再局限于外围辅助工作,而是有能力进入财务审批、供应链调度等核心生产系统。安全底座的夯实,让AI从“工具”进化为值得信赖的“伙伴”。这种信任机制的完善,是Agent能够全面接管核心业务的前提。
最后
站在2025年的终点,我们看到的是技术理性的回归和应用深度的拓展。
APP依然繁荣,但它不再是唯一的交互形态。代码依然重要,但它的价值正在向设计与创新迁移。对于真正的创造者来说,这场由Agent驱动的变革,为开发者的能力成长、企业的架构升级提供了前所未有的广阔空间。
AgentKit降低了创新门槛,推理服务优化了运营成本,多模态技术提升了交互体验。我们终于可以从繁琐的底层实现中解脱出来,去思考那个最根本的问题:我们如何利用AI为用户创造更大的价值?
2026年,行业将进入精耕细作的新阶段,这将是一场润物细无声但波澜壮阔的Agent迁徙。在这场变革中,保持敏锐,拥抱进化,是“科技不许冷”笃定的态度。
毕竟,当你的同行正在用70行代码构建超级助手,准备在2026年大展宏图时,这正是我们通过技术创新,重塑竞争力的最佳时刻。
特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)



