
撰文 | 雁 秋
编辑 | 李信马
题图 | IC Photo
说起2025年的科技与产业领域,具身智能是绕不开的关键词。它是怎么被公众记住的呢?蛇年春晚舞台应该是一切的起点,16台人形机器人首次完成真正意义上的“破圈”,拉开一场具身智能风暴。
在专业视角下,具身智能被理解为一种拥有物理身体、能通过感知环境并自主决策、进而与动态世界交互的智能实体。它不仅代表人工智能从虚拟向实体的“范式跃迁”,也被视为人工智能与机器人学的深度融合。

图源:蛇年春晚 宇树机器人
2025年,具身智能被写入《政府工作报告》,二十届四中全会审议通过的“十五五”规划建议将其列为前瞻布局的未来产业之一,标志着国家对这一前沿技术战略价值的正式认可。
2025年,具身智能成为厂商押注、资本涌入的核心战场,相关板块热潮涌动,相关概念持续升温。据开源证券统计,中国具身智能领域融资总金额已超过500亿元,融资事件超过200起,较2024年全年增长超400%。
2025年,一大批具身智能产品从虚拟的数字世界走进真实的物理空间:有的可以走进工厂组装、搬运,有的化身厨师烹饪、制作咖啡,有的能够讲解接待、提供文娱商演,有的甚至可以给老人洗发、做艾灸......
我们站在这场风暴的起点,看到企业一步步从展示炫酷Demo到验证技术、打磨产品、寻找场景。资本涌入、场景落地交织在一起,共同推动这个“AI长出四肢”的交叉物种走出实验室。
但隐忧并未消散,产业仍面临模型、本体与数据的挑战,具身智能远未达到泛化能力。技术链条的成熟性、市场预期是否过热以及人机共存的未来将会如何,还有很多可以讨论的空间。
01、关键词:技术——从理解世界到自主行动
具身智能在2025年的最显著变化,是技术架构的转变。
根据世界机器人大会发布的《2025具身智能机器人十大发展趋势》,具身智能正从「物理实践、物理模拟器与世界模型协同驱动的具身感认知」到「多层次端到端的具身决策」全方位演进。

图源:2025外滩大会
想要理解这句话是什么意思,我们需要简单拆分下,了解物理实践、物理模拟器、世界模型,以及多层次端到端的概念。
想象一下,你要求家庭机器人“把餐桌收拾干净”。对人类来说,这是简单的指令,但机器人需要识别各种物品、理解“收拾”的含义、规划动作顺序,并应对突发情况——比如移动的宠物或滑落的餐具。
实现这一目标的核心,不仅要依托大模型的算法,还要将机器的身体结构以及与环境的互动紧密关联起来。这就要求机器人要建立对物理世界的认知基础,就像人类婴儿通过触摸、观察和互动来学习世界运行规律的过程。
物理实践,是机器人学习的根本途径,是让机器人在与真实环境的互动中积累经验,理解物体属性、力学规律和动作后果。
物理模拟器,可以看做一个高效“训练场”,机器人可以在高保真的虚拟环境中进行数百万次试错学习,加速技能掌握。
世界模型,则是机器人的“想象力引擎”。它通过从海量数据中提炼环境运行规律,使机器人能在行动前进行“思维”,预测不同行动可能产生的结果。
当机器人具备了基本的世界理解能力后,挑战就转向如何将这些理解转化为实际行动——这正是“多层次端到端的具身决策”要解决的问题。
多模态大模型在这一转变中扮演了关键角色,它能够整合视觉、语言、触觉等多种信息,理解复杂指令的深层含义,并生成相应的行动计划。就像是给具身智能嵌入了“大脑”,让其推理、交互等方面的智能水平明显提升。
在这一技术范式下,两种主流架构并行发展:端到端的具身模型(例如VLA)和分层决策模型,它们代表了两种截然不同的技术哲学。
- 端到端具身模型:可实现直接端到端的从人类指令到机器执行,即输入是图像及文本指令,输出的是动作。
- 分层决策模型:大模型担任指挥官,传统控制技术充当执行者。这是目前主流的工程化思路,其核心在于将“思考”与“执行”解耦,形成清晰的决策链条。
未来的趋势并非简单的二选一,而是走向分层与端到端的有机融合。一方面,高层任务规划和语义理解将保持模块化以确保可解释性;另一方面,底层技能的执行将通过端到端学习或“世界模型”的训练,变得越来越通用、灵活和自适应。
需要注意的是,在2025年,数据基础依旧是具身智能发展的关键瓶颈与突破点。具身智能需要上亿条训练数据才能达到完全自主水平,但现有公开数据集最大仅在百万量级。
为解决这一难题,产业界正从两个方向努力:基于物理实体采集与仿真合成构建大规模高质量具身智能数据集。与此同时,科研界期望在保证质量的前提下,让数据规模“变小”,通过更高效的数据利用提升训练效率。
可以预测,2026年能抢到数据话语权的企业,日子不会过得太差。
02、关键词:产业——头部差异化路径与竞争格局
2025年,国家政策对具身智能产业的支持力度达到新高,具身智能首次被写入政府工作报告,成为国家未来产业重点培育方向。与此同时,北京、上海、深圳等地同步发力,通过设立千亿级产业基金、开展核心技术攻关专项、完善基础设施配套等举措,形成了“国家-地方”协同推进的产业发展格局。
摩根士丹利统计显示,2025年下半年,中国具身智能厂商披露的订单总额已超20亿元。具身智能行业正站在产业化的门槛上。
伴随着“订单潮”,行业竞争从产品层面升级至生态层级,不同类型的具身智能企业选择了差异化的发展路径,形成了多元化的产业生态——工业派、技术派以及场景派。
- 工业派
深耕制造,追求群体智能与高效生产,以优必选、智平方为代表。
优必选提出的「群脑网络软件架构」,推动工业人形机器人从单机自主向群体智能进化。目前已与东风柳汽、吉利汽车、比亚迪等多家车企达成合作。
智平方走通了“模型+场景”的闭环路径,在汽车制造、生物科技、半导体制造等多个高价值场景实现商业落地。公司与华熙生物合作,部署机器人在无菌车间执行物料转运、智能拆包等任务;2025年4月发布全域全身VLA大模型,并与东风柳汽合作,将机器人应用于汽车制造全场景。

图源:优必选官网
- 技术派
专注于核心模型与算法突破,探索通用智能边界,以宇树科技、智元为代表。
智元在2025年推出了全球首个“个人机器人”启元Q1,主要面向极客玩家、家庭以及科研教育等用户。这款小尺寸全身力控人形机器人可以折叠后装进双肩包,极大地降低了科研试错成本。
宇树科技则持续优化机器人运动控制能力。在第七届北京智源大会上,宇树G1展示了敏捷的格斗动作,以及出色的语音对话、环境感知和行动决策能力。CEO王兴兴明确表示,这些表演性展示并非终极目标,解放人类生产力才是机器人的使命。
- 场景派
深入垂直行业,解决具体痛点,以云深处科技为代表。
云深处启动A股上市辅导,主要产品包括四足机器人、人形机器人及核心零部件,四足机器人已实现上下楼梯、自主导航等功能,应用于电力巡检、应急救援等领域。目前,其绝影X30四足机器人已在电力巡检场景中实现1000+小时平均无故障工作,并能够自主判断电量前往充电桩充电。
更令人印象深刻的是,云深处的机器人深入可可西里无人区,伪装成“机器藏羚羊”近距离观察野生动物,展现了在极端环境下的卓越适应能力。
2025年10月,《具身智能产业图谱》正式发布,清晰呈现了产业生态布局、上下游协同关系及重点企业分布,为从业者提供了全景式产业“导航仪”。在应用场景拓展方面,2025年科技创变者大会发布了“具身智能行业十大应用场景”,覆盖物流、零售、制造、海洋、能源等关键领域。
产业落地的速度令人瞩目。智元机器人预计2025年真实出货量超5000台,销售额超10亿元。优必选Walker系列人形机器人2025年全年订单总金额已达到13亿元(不含全尺寸科研教育人形机器人“天工行者”及小型人形机器人“AI悟空”)。其工业人形机器人产能已达到每月300台,预期全年交付量将超过500台。
但现实情况是,核心挑战依然存在。摩根士丹利的报告指出,许多厂商高调宣布的“大额订单”中,相当一部分属于框架协议或意向订单,而非确定性的采购合同,且产能不足成为行业普遍痛点。
政策层面也提出了要求,国家发改委在2025年11月27日的新闻发布会上明确指出,随着新兴资本加速入场,需要“着力防范重复度高的产品‘扎堆’上市、研发空间被压缩等风险”。这意味着,缺乏核心技术、仅靠组装和模仿的企业生存空间将急剧缩小。
03、关键词:市场——从“表演经济”到“价值创造”
若用一个词来形容2025年具身智能在资本市场的发展状态,“狂热”或许最为贴切。
据不完全统计,2025年前三季度,国内机器人行业新增一级市场融资事件达610笔,融资总额约500亿元,是去年同期的2.5倍。创投数据平台IT桔子显示,截至12月18日,2025年至少有165家具身智能企业完成303次融资,累计融资金额近370亿元,较2024年全年增长近260%。
资本火热下注的同时,具身智能在2025年也完成了表演型到实用型的转变。
上半年,从蛇年春晚舞台上人形机器人的表演,到深圳地铁智能安检机器人上岗,再到全球首个人形机器人马拉松在北京开跑,这些高调亮相不仅吸引了公众目光,也为行业带来了前所未有的关注度。
这一时期,具身智能的价值主要体现在吸引投资、提升品牌和公众教育上。诸如舞蹈、握手、倒立、拳击等互动,程序高度预设,环境被严格控制。机器人被要求“完成即胜利”,不计成本和稳定性。
这种以“炫技”为导向的发展模式很快显露出其局限性,有人直言,这种表演更像是打着改变人类生活口号而建的秀场。
转变发生在多模态大模型的落地,这一技术使得机器人可以不再依赖预设程序执行任务,而是具备了在开放环境中理解意图、规划动作、应对扰动的能力。
这一时期,具身智能的核心是融入生产流与服务链,解决具体问题并证明经济性,价值直接体现在降本、增效、提升安全与质量。比如在工厂,工人只需对机器人说“把那个有毛刺的零件挑出来返工”,机器人便可通过视觉识别、路径规划自主完成全套动作。
在2025世界机器人大会上,我们看到了可视化的进展。200余家国内外企业集中展示了落地成果,机器人不再是整齐划一的静态陈列,而是进入高重复、高危、高成本的场景,从单纯的生产工具,转变为兼备数据采集、经验沉淀乃至智能贡献的“全能选手”。

图源:DoNews摄
比如开普勒的人形机器人K2“大黄蜂”完成了8小时连续直播工作,模拟了物流分拣、搬运等场景,其研发团队将8小时续航设定为「从实验室样机走向商用产品」的关键一步,旨在适配朝九晚五的班次需求。
在工程场景之外,机器人还进入到其他有趣且与普通人密切相关的场景。
跨维智能的人形机器人 DexForce W1 Pro 在冲咖啡时展现出稳定的长线程工作能力。在机器人准备放置胶囊时,却被工作人员突然拿走,但它并未宕机或陷入混乱,而是短暂地停顿,双眼摄像头重新扫描桌面,几秒后,定位目标,再次精准取回胶囊,继续后续的任务。
京东通过JoyInside平台,将机器人部署在零售、家居等真实场景中交互和销售,2025年“618”期间其智能机器人销售额大幅增长;美团与合作伙伴打造全球首个人形机器人智慧药房,实现24小时无人化药品拣选和交付,旨在降低服务履约成本。
这些都证明了机器人已经可以在生活中给人们提供便利。
与此同时,更多场景的应用推动机器人公司的业绩增长。宇树科技王兴兴公开表示,公司2024年度营收规模已达到约10亿元。该公司近日已完成IPO辅导,智元机器人已完成股改,还有乐聚机器人正在IPO辅导中。
04、关键词:认知——从“替代恐惧”到“价值审视”
假设机器人全面进入人类的生活,那会是什么样子?
电视剧《世界奇妙物语》描绘过这样的画面:在剧中,代替人类的机器人每天重复着相似的言行,去完成常规的工作任务,而人类只需穿戴智能设备,长年在睡眠舱中过上梦寐以求的日子……
然而在现实生活中,人们对机器人的到来首先感到的是「恐惧」。2025年初,社交媒体上关于“哪个职业先被替代”的讨论如火如荼,大家担忧着自己的职业生涯即将被冰冷的机器人终结。
技术进步与劳动力就业关系的讨论由来已久。1980年计算机开始普及,《纽约时报》曾忧心忡忡:“打字员将在10年内消失。”技术水平的发展使得越来越多标准化的工作岗位面临自动化压力。11月6日,市场研究机构Forrester Research发布报告称,到2029年,机器人流程自动化和人工智能技术,将为40%以上的公司创造出数字工人,届时,美国约有10%的工作岗位将被机器人取代。
然而,在这种担忧焦虑情绪的另一面,也有「太低估人类智慧」的乐观论调。
数据显示,计算机普及后直到2024年,全球打字员岗位确实减少了60%,却新增了2.3亿个“数据录入员”“程序员”“新媒体编辑”岗位——这些岗位都需要“用计算机工作”,而非“被计算机替代”。
而麦肯锡2024年研究预测:到2030年,人形机器人将替代全球1.2亿个“纯流程化岗位”(如流水线组装、简单分拣、基础客服),但会创造1.5亿个“人机协作岗位”,包括:机器人运维工程师(负责机器保养和故障维修)、人机交互设计师(优化机器人与人类的配合流程)、伦理监管员(确保机器人操作符合社会规范)等。
技术史早已证明:新工具的出现,会淘汰“低价值重复劳动”,但同时也会创造“高价值协作劳动”。人形机器人的普及,同样遵循这个逻辑。更关键的是,创造出的新岗位薪资往往更高。
更有一部分人,在思考人类与机器人如何共存的哲学命题。
阿里巴巴集团董事长蔡崇信曾在一次公开对话中反问:“如果你想要一个机器人来清洁地毯,你真的希望它看起来像人类吗?那样我可能会害怕。”这一观点反映了部分人对技术形态的理性期待——功能决定形式,而非盲目追求拟人化。
中央美术学院教授费俊也提出了类似的观点,他表示,每一次科技浪潮都伴随着“效率神话”——技术会解放生产力,让你有更多自由时间。“但解放出来的时间会属于你吗?好像从来不是。多数人时间不是让你去玩耍,只会被更多的工作填满。”

图源:横琴-澳门国际数字艺术博览会
技术本身无法自动带来人类解放,除非我们同时调整社会结构、工作模式和价值评判标准。当机器人承担更多标准化任务时,人类是否真正获得了更多创造、休闲和思考的时间,还是仅仅被卷入新的效率竞赛?
人类面临的真正挑战不是与机器竞争效率,而是如何坚守和发展那些使我们之所以为人的特质:创造力、同理心、审美能力和对意义的追求。2025年,人们对于机器人的看法变得更加理性,在让机器变得更像人的同时,我们更应确保人不会变得更像机器。这种平衡的艺术,将定义未来人机关系的和谐程度。
尾声
假如去看Gartner技术成熟度曲线,会发现一个普遍的趋势:一个产业要正常发展,不可避免要经历波峰波谷现象,从技术萌芽期、期望膨胀期、泡沫破裂低谷期,再到稳步爬升恢复期、生产成熟期,这是每个行业发展都存在的周期性。

图源:Gartner
既然如此,眼前的狂热与争议便不足为奇。资本如潮水般涌入,催生了繁荣,也堆起了泡沫。但在风险可控的情况下,适度的泡沫或者发展困境是可以接受的,甚至是必要的。关键在于如何促进产业进步、技术突破以及如何吸引更多优秀人才参与具身智能的研究之中。
这场“AI长出四肢”的革命,最终考验的或许不是机器能变得多像人,而是人类能否借此契机,变得更加像“人”——更智慧地规划技术路径,更有远见地构建协作框架,更坚定地捍卫那些无法被算法量化的价值。



