文 | 多乐
2026 年 4 月 24 日,OpenAI 刚扔出 GPT-5.5,试图把大模型定价权往上拉一截。几个小时后,梁文锋做了一个让硅谷措手不及的动作。
DeepSeek V4预览版上线了。没有发布会,没有演讲稿,就一组数字:百万 token 输入,缓存命中后 1 块钱。Flash 版更狠,两毛钱。梁文锋似乎在用 DeepSeek V4 告诉硅谷:你想涨价随便涨,我接着往下打。
而 V4 发布前不到 48 小时,融资传闻也炸了出来:阿里巴巴和腾讯同时盯上了 DeepSeek,估值从传言中的 100 亿美元一路被拉到超过 200 亿美元。两家巨头预计合计投资 18 亿美元,不到一周时间估值翻倍,资本市场从来不相信什么情怀,肯给这个价,说明有人嗅到了新信号。
这十五个月,DeepSeek 沉默了太久。2025 年 1 月 R1 横空出世的时候,英伟达一天市值蒸发了近 6000 亿美元,全球 AI 圈都在喊 DeepSeek 时刻。之后呢?整整一年多没有大版本更新,发布窗口一延再延,从年初推到春天,从 2 月推到快 4 月底。外界开始嘀咕:是不是瓶颈了?是不是算力被卡死了?是不是那个靠幻方量化输血做开源的天才终于烧不动了?
但今年 4 月 22 日,一切变了。憋了十五个月之后,梁文锋直接掀了牌桌。一边用开源模型把成本打到脚踝,一边用资本市场的翻倍估值告诉所有人:那个躲在幻方量化的利润背后、不接投资人电话的理想主义者,没了。
取而代之的,是一个更凶猛的 DeepSeek。
01
把模型成本打下来,比什么都硬核
看 V4 的技术参数,不要被 1.6 万亿总参数唬住,真正要命的是它的成本账。
总参数涨到 1.6 万亿,激活参数 490 亿,MoE 架构下每层 384 个专家。这些数字不重要。重要的是:上下文从 128K 直接顶到 100 万,将近八倍的容量扩张,但每个 token 的算力消耗反而降下来了。KV 缓存占用砍到原来的十分之一。
怎么做到的?不是堆算力,是换算法。用 CSA 和 HCA 混合注意力机制,把全量计算改成稀疏计算,把均匀扫读换成分层精读。说人话就是:以前模型看一篇百万字的小说要逐字逐句看,现在它会跳着看重点,该细的地方细,该略的地方略。
这带来的结果,是价格彻底打穿地板。
DeepSeek V4-Pro 缓存命中后输入价格 1 元/百万 token,Flash 版 0.2 元,输出端最贵也才 2 元。而一天前发布的 GPT-5.5 输出价格是 30 美元/百万 token,差了近 100 倍。不仅是 OpenAI,Gemini 3.1 Pro 定价 12 美元,Claude Opus 4.7 高达 25 美元。V4-Pro 的 3.48 美元直接把大模型前沿区间的价格锚点砸到地板以下。
这不是营销噱头,是工程逻辑层面的降维打击。当开发者发现用 V4 调一次百万上下文的花费还买不了一瓶矿泉水,谁还会去为闭源模型付几十美元?全球开发者用脚投票,答案不用猜。
在《云涌商业》看来,DeepSeek 是 AI 界的拼多多。这个比喻糙,但不离谱。拼多多做的是把下沉市场的价格打穿,DeepSeek 做的是把 AI 调用的成本打穿。拼多多靠的是对供应链的极致压榨,DeepSeek 靠的是对算法和架构的极致重构。
路子不同,意思是一样的,用别人看不懂的模型结构,把成本结构重写一遍,然后拿出一张所有人都无法拒绝的价签。
但 DeepSeek 和拼多多有一个本质区别。拼多多赚钱,DeepSeek 不想靠 API 赚钱。V4 全部开源,采用 MIT 协议,允许免费商用。这哪里是拼多多的生意逻辑,这分明是互联网早期水电煤的气质,把基础设施搭好,把价格降到零,让所有人在上面盖房子。
DeepSeek 自己的话比任何分析都更直白:预计下半年昇腾 950 超节点批量上市后,Pro 版价格还将大幅下调。不是说现在的价格已经够低就不再降了,是越用越便宜,越跑越往下打。这条成本曲线的终点不是盈亏平衡,是零。
DeepSeek 自己也很清醒。官方承认 V4 整体水平还落后 GPT-5.4 和 Gemini-Pro-3.1 大约三到六个月。但这种坦诚不是示弱,是在说:跑分游戏你们玩,我先把成本账算清楚。Agent 爆发的前夜,谁能把百万上下文做成标配,谁就拿到了 AI 工业化最值钱的那张船票。
02
梁文锋终于接起了投资人的电话
梁文锋不融资的故事,之前被讲成了一种技术洁癖。
2025 年初 R1 火了之后,投资圈的电话他一个没接。腾讯、阿里面试的机会,他一个没给。理由很简单:资本会干扰技术判断。他能这么硬气,靠的是幻方量化那个金库。从量化交易的上千亿规模里切出一块持续输送给 AI 研究,持股超过 84%,在 AI 创业圈几乎是独一份的存在。
但到了 2026 年,这条路堵死了。不是幻方赚得不够多,是 AI 竞赛的成本增速远远超过了量化收益的增速。OpenAI、Anthropic 单轮融资动辄上千亿人民币,人才的全球定价权被巨头捏得死死的。
最让梁文锋难受的还不是钱,是核心团队被一个个挖走。
据公开资料,2025 年下半年至今,DeepSeek 至少有 5 名核心研发成员确认离职。第一代大语言模型核心作者王炳宣去了腾讯;V3 核心贡献者罗福莉被雷军挖至小米,出任 MiMo 团队负责人;R1 核心研究员郭达雅被字节大模型团队直接挖走;OCR 系列核心作者魏浩然和多模态成果核心贡献者阮翀也先后离开。这些人覆盖了基座模型、推理、OCR 和多模态四条核心技术主线。
DeepSeek 总共不到 200 人,核心研究团队 100 多人,基模架构团队仅小几十人。在极度依赖个人能力的小团队里,每一个核心研究员的流失都意味着整条技术线的停顿,情怀喂不饱人。
V4 从原定的 2 月发布窗口一拖再拖,核心原因就是算力成本从百万美元级跳到了十亿美元级。幻方再能挣钱,也撑不起这种烧法。融资,从可选项变成了必选项。
融资消息出来后,最炸裂的不是金额本身,虽然也不小,而是估值的拉升速度。从 100 亿美元翻到 200 亿美元以上,几天之内翻倍。这个估值放到同行里看,智谱当前市值超 500 亿美元,MiniMax 超 300 亿美元,但这两家已经商业化运营,拥有 B 端客户和稳定收入流。DeepSeek 迄今未产生收入,200 亿美元的估值已经是一个非商业化公司能够触及的天花板,
资本市场突然意识到,DeepSeek 不再是那个需要被怜悯的小众技术玩家,它是一个确定性的交易标的。
张爱玲说成名要趁早。但梁文锋用这一年半证明了另一件事:在 AI 这场战争里,活到终局比趁早成名重要得多。不缺钱不代表不需要钱,不需要钱不代表不需要一个市值锚定。接起投资人的电话,不是理想主义的溃败,是梁文锋第一次承认,在金钱游戏里,最傻的事就是假装自己不用出牌。
03
华为昇腾,才是 DeepSeek 的隐藏底牌
V4 的公告里藏着一个几乎被忽略的细节:DeepSeek 第一次把华为昇腾写进了官方硬件适配名单。
为了做这个切换,团队把整套原本跑在英伟达 CUDA上的系统全部重写,迁移到华为 CANN 国产框架上。这不是一个轻松的决定。英伟达 GPU 在高端训练场景的优势仍然是碾压级的,华为芯片在算力、工具链、生态上都有明显的差距。
但梁文锋赌的不是眼下这一点算力差距,他赌的是格局。一旦中国有了完全自主可控的 AI 算力底座,美国的芯片管制、贸易制裁就再也掐不住脖子。一周前黄仁勋说了一句话,翻译过来就是:如果 DeepSeek 率先在华为平台上实现了深度优化,对美国的 AI 产业来说,那将是一个可怕的结局。
华为昇腾 950 芯片的量产已经在路上,预计下半年上线。DeepSeek 之所以敢把 V4 的价格压到这么低,不光是算法优化的功劳,更是因为底层的芯片成本已经在换。V4 降了一半价,不是因为心善,是因为换了供应商。
西方媒体注意到了这层含义。彭博说 V4 是对 OpenAI 和 Anthropic 的有力挑战,CNBC 说这是一次全方位的实力展示。路透社的切口更准——这不是单纯的模型迭代,是中国 AI 去英伟达化的关键一步。在代码层面撬动整个 AI 国产化链条,比发布一款模型更让对手坐立不安。
未来的 AI 竞争,不再是单一厂商之间的跑分竞赛,而是中国 AI 生态和美国 AI 生态之间的惨烈绞杀。DeepSeek 用开源释放能量,华为用芯片提供底座。这个组合拿到牌桌上,已经不是卡牌玩家,是规则改写者。
没有人比梁文锋更清楚 AGI 有多远。他也比任何人更清楚,活不到终局的理想主义一文不值。
过去十五个月,DeepSeek 经历了核心高管被挖角,发布窗口一拖再拖,外部舆论从神化到质疑的过山车。2025 年夏天,全球下载量从峰值的 8000 万一路下滑到 2000 万,月活被字节豆包反超。所有信号都在说同一件事:没有资本托底的技术理想,撑不过行业冬天。
V4 和融资同步落地,像梁文锋在棋盘上同时落下的两枚棋子。一个证明他做什么的判断没有变,另一个证明他怎么做的判断已经彻底变了。融资不是理想主义的终结,是理想主义接入了一个更庞大的机器。估值 200 亿美元不仅仅是钱的数目,更是市场对 DeepSeek 能否活到终局投下的信任票。
梁文锋在用别人看不懂的节奏,下一盘更大的棋。这盘棋的名字不叫 R1,不叫 V4,不叫昇腾,甚至不叫 200 亿美元,它叫生存。先活下来,才有资格谈颠覆。
特别声明:本文为合作媒体授权 DoNews 专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表 DoNews 专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)



