憋了十五个月之后，梁文锋直接掀了牌桌- DoNews专栏

文 | 多乐

2026 年 4 月 24 日，OpenAI 刚扔出 GPT-5.5，试图把大模型定价权往上拉一截。几个小时后，梁文锋做了一个让硅谷措手不及的动作。

DeepSeek V4预览版上线了。没有发布会，没有演讲稿，就一组数字：百万 token 输入，缓存命中后 1 块钱。Flash 版更狠，两毛钱。梁文锋似乎在用 DeepSeek V4 告诉硅谷：你想涨价随便涨，我接着往下打。

而 V4 发布前不到 48 小时，融资传闻也炸了出来：阿里巴巴和腾讯同时盯上了 DeepSeek，估值从传言中的 100 亿美元一路被拉到超过 200 亿美元。两家巨头预计合计投资 18 亿美元，不到一周时间估值翻倍，资本市场从来不相信什么情怀，肯给这个价，说明有人嗅到了新信号。

这十五个月，DeepSeek 沉默了太久。2025 年 1 月 R1 横空出世的时候，英伟达一天市值蒸发了近 6000 亿美元，全球 AI 圈都在喊 DeepSeek 时刻。之后呢？整整一年多没有大版本更新，发布窗口一延再延，从年初推到春天，从 2 月推到快 4 月底。外界开始嘀咕：是不是瓶颈了？是不是算力被卡死了？是不是那个靠幻方量化输血做开源的天才终于烧不动了？

但今年 4 月 22 日，一切变了。憋了十五个月之后，梁文锋直接掀了牌桌。一边用开源模型把成本打到脚踝，一边用资本市场的翻倍估值告诉所有人：那个躲在幻方量化的利润背后、不接投资人电话的理想主义者，没了。

取而代之的，是一个更凶猛的 DeepSeek。

把模型成本打下来，比什么都硬核

看 V4 的技术参数，不要被 1.6 万亿总参数唬住，真正要命的是它的成本账。

总参数涨到 1.6 万亿，激活参数 490 亿，MoE 架构下每层 384 个专家。这些数字不重要。重要的是：上下文从 128K 直接顶到 100 万，将近八倍的容量扩张，但每个 token 的算力消耗反而降下来了。KV 缓存占用砍到原来的十分之一。

怎么做到的？不是堆算力，是换算法。用 CSA 和 HCA 混合注意力机制，把全量计算改成稀疏计算，把均匀扫读换成分层精读。说人话就是：以前模型看一篇百万字的小说要逐字逐句看，现在它会跳着看重点，该细的地方细，该略的地方略。

这带来的结果，是价格彻底打穿地板。

DeepSeek V4-Pro 缓存命中后输入价格 1 元/百万 token，Flash 版 0.2 元，输出端最贵也才 2 元。而一天前发布的 GPT-5.5 输出价格是 30 美元/百万 token，差了近 100 倍。不仅是 OpenAI，Gemini 3.1 Pro 定价 12 美元，Claude Opus 4.7 高达 25 美元。V4-Pro 的 3.48 美元直接把大模型前沿区间的价格锚点砸到地板以下。

这不是营销噱头，是工程逻辑层面的降维打击。当开发者发现用 V4 调一次百万上下文的花费还买不了一瓶矿泉水，谁还会去为闭源模型付几十美元？全球开发者用脚投票，答案不用猜。

在《云涌商业》看来，DeepSeek 是 AI 界的拼多多。这个比喻糙，但不离谱。拼多多做的是把下沉市场的价格打穿，DeepSeek 做的是把 AI 调用的成本打穿。拼多多靠的是对供应链的极致压榨，DeepSeek 靠的是对算法和架构的极致重构。

路子不同，意思是一样的，用别人看不懂的模型结构，把成本结构重写一遍，然后拿出一张所有人都无法拒绝的价签。

但 DeepSeek 和拼多多有一个本质区别。拼多多赚钱，DeepSeek 不想靠 API 赚钱。V4 全部开源，采用 MIT 协议，允许免费商用。这哪里是拼多多的生意逻辑，这分明是互联网早期水电煤的气质，把基础设施搭好，把价格降到零，让所有人在上面盖房子。

DeepSeek 自己的话比任何分析都更直白：预计下半年昇腾 950 超节点批量上市后，Pro 版价格还将大幅下调。不是说现在的价格已经够低就不再降了，是越用越便宜，越跑越往下打。这条成本曲线的终点不是盈亏平衡，是零。

DeepSeek 自己也很清醒。官方承认 V4 整体水平还落后 GPT-5.4 和 Gemini-Pro-3.1 大约三到六个月。但这种坦诚不是示弱，是在说：跑分游戏你们玩，我先把成本账算清楚。Agent 爆发的前夜，谁能把百万上下文做成标配，谁就拿到了 AI 工业化最值钱的那张船票。

梁文锋终于接起了投资人的电话

梁文锋不融资的故事，之前被讲成了一种技术洁癖。

2025 年初 R1 火了之后，投资圈的电话他一个没接。腾讯、阿里面试的机会，他一个没给。理由很简单：资本会干扰技术判断。他能这么硬气，靠的是幻方量化那个金库。从量化交易的上千亿规模里切出一块持续输送给 AI 研究，持股超过 84%，在 AI 创业圈几乎是独一份的存在。

但到了 2026 年，这条路堵死了。不是幻方赚得不够多，是 AI 竞赛的成本增速远远超过了量化收益的增速。OpenAI、Anthropic 单轮融资动辄上千亿人民币，人才的全球定价权被巨头捏得死死的。

最让梁文锋难受的还不是钱，是核心团队被一个个挖走。

据公开资料，2025 年下半年至今，DeepSeek 至少有 5 名核心研发成员确认离职。第一代大语言模型核心作者王炳宣去了腾讯；V3 核心贡献者罗福莉被雷军挖至小米，出任 MiMo 团队负责人；R1 核心研究员郭达雅被字节大模型团队直接挖走；OCR 系列核心作者魏浩然和多模态成果核心贡献者阮翀也先后离开。这些人覆盖了基座模型、推理、OCR 和多模态四条核心技术主线。

DeepSeek 总共不到 200 人，核心研究团队 100 多人，基模架构团队仅小几十人。在极度依赖个人能力的小团队里，每一个核心研究员的流失都意味着整条技术线的停顿，情怀喂不饱人。

V4 从原定的 2 月发布窗口一拖再拖，核心原因就是算力成本从百万美元级跳到了十亿美元级。幻方再能挣钱，也撑不起这种烧法。融资，从可选项变成了必选项。

融资消息出来后，最炸裂的不是金额本身，虽然也不小，而是估值的拉升速度。从 100 亿美元翻到 200 亿美元以上，几天之内翻倍。这个估值放到同行里看，智谱当前市值超 500 亿美元，MiniMax 超 300 亿美元，但这两家已经商业化运营，拥有 B 端客户和稳定收入流。DeepSeek 迄今未产生收入，200 亿美元的估值已经是一个非商业化公司能够触及的天花板，

资本市场突然意识到，DeepSeek 不再是那个需要被怜悯的小众技术玩家，它是一个确定性的交易标的。

张爱玲说成名要趁早。但梁文锋用这一年半证明了另一件事：在 AI 这场战争里，活到终局比趁早成名重要得多。不缺钱不代表不需要钱，不需要钱不代表不需要一个市值锚定。接起投资人的电话，不是理想主义的溃败，是梁文锋第一次承认，在金钱游戏里，最傻的事就是假装自己不用出牌。

华为昇腾，才是 DeepSeek 的隐藏底牌

V4 的公告里藏着一个几乎被忽略的细节：DeepSeek 第一次把华为昇腾写进了官方硬件适配名单。

为了做这个切换，团队把整套原本跑在英伟达 CUDA上的系统全部重写，迁移到华为 CANN 国产框架上。这不是一个轻松的决定。英伟达 GPU 在高端训练场景的优势仍然是碾压级的，华为芯片在算力、工具链、生态上都有明显的差距。

但梁文锋赌的不是眼下这一点算力差距，他赌的是格局。一旦中国有了完全自主可控的 AI 算力底座，美国的芯片管制、贸易制裁就再也掐不住脖子。一周前黄仁勋说了一句话，翻译过来就是：如果 DeepSeek 率先在华为平台上实现了深度优化，对美国的 AI 产业来说，那将是一个可怕的结局。

华为昇腾 950 芯片的量产已经在路上，预计下半年上线。DeepSeek 之所以敢把 V4 的价格压到这么低，不光是算法优化的功劳，更是因为底层的芯片成本已经在换。V4 降了一半价，不是因为心善，是因为换了供应商。

西方媒体注意到了这层含义。彭博说 V4 是对 OpenAI 和 Anthropic 的有力挑战，CNBC 说这是一次全方位的实力展示。路透社的切口更准——这不是单纯的模型迭代，是中国 AI 去英伟达化的关键一步。在代码层面撬动整个 AI 国产化链条，比发布一款模型更让对手坐立不安。

未来的 AI 竞争，不再是单一厂商之间的跑分竞赛，而是中国 AI 生态和美国 AI 生态之间的惨烈绞杀。DeepSeek 用开源释放能量，华为用芯片提供底座。这个组合拿到牌桌上，已经不是卡牌玩家，是规则改写者。

没有人比梁文锋更清楚 AGI 有多远。他也比任何人更清楚，活不到终局的理想主义一文不值。

过去十五个月，DeepSeek 经历了核心高管被挖角，发布窗口一拖再拖，外部舆论从神化到质疑的过山车。2025 年夏天，全球下载量从峰值的 8000 万一路下滑到 2000 万，月活被字节豆包反超。所有信号都在说同一件事：没有资本托底的技术理想，撑不过行业冬天。

V4 和融资同步落地，像梁文锋在棋盘上同时落下的两枚棋子。一个证明他做什么的判断没有变，另一个证明他怎么做的判断已经彻底变了。融资不是理想主义的终结，是理想主义接入了一个更庞大的机器。估值 200 亿美元不仅仅是钱的数目，更是市场对 DeepSeek 能否活到终局投下的信任票。

梁文锋在用别人看不懂的节奏，下一盘更大的棋。这盘棋的名字不叫 R1，不叫 V4，不叫昇腾，甚至不叫 200 亿美元，它叫生存。先活下来，才有资格谈颠覆。

特别声明：本文为合作媒体授权 DoNews 专栏转载，文章版权归原作者及原出处所有。文章系作者个人观点，不代表 DoNews 专栏的立场，转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)