DeepSeek横空出世,让阿里工程师春节加班追赶

DoNews6月11日消息,据彭博社与南华早报报道,阿里巴巴董事会主席蔡崇信近日在巴黎VivaTech大会上坦言,一场由DeepSeek引发的危机感,迫使这家科技巨头以“春节不休”的决心,加速追赶。

今年1月,DeepSeek以其低成本、高性能的AI模型震惊业界时,阿里巴巴的工程师们感受到了巨大的压力。“我们看了相关论文,心想,‘天哪,怎么我们落后了?明明大家做的是一样的事。’”蔡崇信回忆道。

“我们的工程主管当即决定:‘取消春节假期,所有人都留在公司,睡在办公室里。我们要加快研发进度。’几周之内,我们就推出了自己的版本,也就是Qwen系列模型,表现不错,竞争力很强。”

蔡崇信解释了公司选择将Qwen模型开源的核心逻辑:这不仅是为了在技术上与对手一较高下,更重要的是为了“让AI使用更加普及”,从而推动各类应用的爆发式增长,最终反哺阿里巴巴的核心业务——云计算。

“开源带来的好处在于……它会拉动对AI训练和推理资源的需求,”蔡崇信指出,“我们也看到,未来推理等环节会有大量需求。”

根据第三方平台Hugging Face的排名,阿里的Qwen模型目前已成为全球最受欢迎的开源大型语言模型之一。

作为与马云共同创立阿里巴巴的元老,蔡崇信对自己回归时的感受直言不讳:“我看到这家公司有些迷失了方向,扩张得有点过头。”他坦承,在过去几年里,公司经历了“一段极其艰难的时期”,面临着“激烈的市场竞争”、疫情冲击、监管压力以及地缘政治紧张等多重挑战。上月,他甚至用“连续遭遇挫折”来形容公司的困境。

阿里承诺,未来三年将在数据中心等AI基础设施上投入超过3800亿元人民币(约合530亿美元)。蔡崇信今年早些时候还曾透露,阿里巴巴已与苹果公司达成合作,为iPhone提供AI技术。

DeepSeek横空出世,让阿里工程师春节加班追赶
扫描二维码查看原文
分享自DoNews
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1