撰文 | 曹双涛
编辑 | 杨博丞
题图 | IC Photo
DeepSeek让腾讯在大模型的战略布局上,从此前的“相对尴尬”调整为“激进”。
投流作为移动端AI大模型产品获取用户的重要方式,2024年10月至2025年1月Kimi、腾讯元宝、豆包月平均消耗投流费用分别为1.59亿元、3283万元、3607万元。换言之,Kimi的月平均消耗投流费用为腾讯元宝和豆包的4.8倍和4.4倍。
图源:基于App Growing官网公开数据整理 DoNews制图
疯狂投流让Kimi和元宝在用户体量和月活上存在明显差距,今年1月国内AI产品榜排名中,Kimi和腾讯元宝排名分别为TOP3和TOP14,同期对应的MAU分别为19.43M和3.59M。
图源:AI产品榜官网
DeepSeek爆火后,腾讯宣布接入DeepSeek R1模型和上线自家研发的Hunyuan T1大模型,目前腾讯元宝同时支持Hunyuan T1和DeepSeek两款大模型的使用。刚刚结束的2月,元宝更是开启疯狂投流模式,其2月份3.03亿元的广告消耗金额为1月份的14.62倍,3月1日单日消耗广告金额,远超2024年10月至2025年1月四个月平均消耗广告金额。
图源:腾讯元宝官网
图源:App Growing官网
和元宝不同的是,DeepSeek改变Kimi对广告的依赖,希望通过技术突破吸引更多用户。今年2月,Kimi的月广告消耗金额已大幅度降至4425万元。
图源:App Growing官网
投放策略上,元宝多以腾讯自家广告为主。以2月份为例,腾讯广告、百度营销、巨量广告消耗占比分别为96.07%、0.95%、0.23%。整套组合拳的打出,让元宝在下载量完成对豆包的碾压。2月22日至3月1日腾讯元宝多日霸榜中国区App Store免费榜TOP2,仅此DeepSeek。
图源:App Store
但结合我们对元宝多项功能实测来看,其面临着如功能相对单一、回复质量上仍需提高、缺乏重磅撒手锏AI应用带来的同质化竞争、现有AI功能相较友商仍存在差距等多重问题。上述问题的存在,让元宝面临用户流失的同时,商业化同样成为难题。
一、元宝是满血版DeepSeek,还是阉割版DeepSeek?
检索用户提问中的关键词→选取大量文章信息→引用主要文章信息→按照逻辑回复用户问题。这是元宝Hunyuan T1和DeepSeek联网联网状态的运行模式。除选取文章多以公号和视频号、专业性学术文章相对较少外。结合对元宝的大量实测来看,这种回复模式存在不少问题。
图源:元宝PC版
如何深层次理解佛家提出的我执,执念?元宝引用的10篇文章中1篇来自头条号,但原文在头条平台上阅读量惨淡,评论量更是为零。且从原文排版来看,颇有从DeepSeek直接复制嫌疑。
引用的9篇公号文章中如《破除“我执”:从原始佛教到大乘的深刻洞见》《【发菩提心】开悟难在破“我执”,不破我执不见佛》阅读量分别为7和258。
换言之,在当前“流量为王”,互联网平台信息真假参半,虚实混合的时代,元宝在回复用户问题时,不仅未对信息源进行筛选,且使用大量个人账号下的低阅读文章,这很容易影响回复质量的权威性。
图源:元宝PC版
图源:头条PC版
作为对比,即使字节旗下有大量头条号作者,但豆包在回复用户问题时,多引用官网和媒体报道以及知乎文章,并不使用头条号文章,尽可能确保信息源的可靠性。
图源:豆包PC版
分手为何难以走出?元宝在引用多篇文章后给出的原因是:情感联结的惯性、未完成情结与自我认同危机、社会文化压力。但来自河南省某情感咨询机构负责人张明(化名)坦言,元宝的这些回复仅停留在表面,每个成年人都戴着各种面具生活,将分手难以走出和社会压力强行联系,未免有些过度牵强。
从业近10年接触几万个案例后发现,很多人分手难以走出的根源是,自我内心过于匮乏。真正想要走出分手的痛苦是要学会“观我”,找到自我内心匮乏的根源,这不仅能快速走出痛苦,且能避免在下段感情中重蹈覆辙。
换言之,在当前用户信息来源多元化、信息严重过载的今天,对现有信息的整合的元宝,虽能帮助用户大幅度节省时间,但用户缺的从来不是信息,而是真正有价值、有差异化的信息,这正是DeepSeek爆火的原因。若元宝回复用户问题,本就是在用户的认知范围内,未给用户带来更多增量、差异化、深度思考的信息,元宝恐难以满足不同用户的差异化需求。
图源:元宝PC版
请提炼全英文的这篇报道(如下图):
图源:ekathimerini
元宝在回复问题时,大量使用的链接4文章发布时间为2024年12月2日,和该篇文章报道时间存在明显偏差。且原文报道中并未提及,工会要求政府应对生活成本危机,包括提高最低工资、抑制通胀及住房成本等问题,但元宝在引用链接4文章的基础上自行添加。
图源:元宝PC版
图源:微信
比元宝回复该问题更糟糕的是百度AI,百度AI引用的8篇文章中,部分文章发布时间为2022年。换言之,接入DeepSeek的元宝和百度AI,出现自说自话,执行指令欠佳的情况。如何真正理解用户指令,引用正确时间点文章作为信息源,仍需厂商不断优化。
图源:百度
图源:百度
尤其是从ChatGPT爆火后,大量个人和自媒体机构通过批量账号+批量生成文章的打法,试图通过“用算法打败算法”来提高收益。与之而来的问题是,AI用AI生成的文章来回复用户问题,用户继续发布大量AI文章。恶性循环模式下,AI大模型又要如何不断提高回复质量呢?
Mirror里有几个r?元宝给出各种分析和推理,最后答案是Mirror中有两个r,出现明显错误。
图源:元宝PC版
小洋的功课一直在班上是第一,为什么这次却降到第三?脑筋急转弯给出的答案很简单:因为两个人的分数超过他。元宝并未能真正理解这个问题是脑筋急转弯问题,给出学习方法调整滞后、心理压力和情绪波动等各种原因分析。
换言之,AI在处理问题时,很容易将简单问题复杂化。整体测试后发现,元宝在回复问题的质量和水平上,更像是一个阉割版的DeepSeek,和满血版的DeepSeek仍有明显差距。
图源:元宝PC版
二、能力欠佳、功能相对单一
目前元宝的功能相对简单,除基于发现好问题出现的热搜外(PC版不搭载),AI功能为常见的文档总结、网页总结、AI作图、问题回复、文生文,甚至文生视频都未出现在元宝中。缺乏能够形成用户心智的重磅级撒手锏AI应用、功能的相对简单、相较友商功能的同质化,或许是元宝疯狂投流获取用户的重要原因。
对标移动互联网时代来看,移动应用或在功能相对刚需,或相较友商功能更丰富,更能满足用户需求,才能实现较高的用户留存率。但结合实测来看,元宝在其他方面的AI能力同样存在短板。
图源:元宝小程序
请以浅咖色背景+碟子中放牛肉酱实物+外层几粒大牛肉+后面放置牛肉酱瓶子+7个字卖点,生成电商平台主图。我们将该指令同时给到在即梦AI、豆包、百度AI、元宝,四款AI大模型生成图片如下:
图源:基于百度AI、即梦AI、元宝、豆包生成图片整理
国内某家食品企业电商经理张磊(化名)告诉我们,四款大模型生成的图片中,即梦AI因主体鲜明、产品内容突出更符合需求。作为对比,元宝生成的图片存在不少问题。
比如,牛肉酱多以玻璃瓶为主、品牌名称被模糊化处理、碟子的牛肉像是豆瓣酱或碎肉糊状、碟子四周的牛肉颗粒过小、后侧小碟子中放入的蔬菜无意义、图片层次感欠佳、主色调偏暗易出现点击率偏低问题。
虽说因图片版权问题,目前AI生成的图片难以直接商用,但设计师可根据AI生成的图片进行“学习和模仿”,但元宝生成的图片几乎很难被设计师和电商从业者所青睐。
我们将难度升级,在中国风减肥促销海报中,我们对风格、核心元素配色、构图、质感上均有明确要求。四款AI大模型生成的图片中,元宝相较百度AI、即梦AI、豆包大模型生成的图片,存在不少问题。
比如,元宝设计的剪纸风不符合要求的国潮插画风,主元素使用的仙女形象更像是静态风格,未能突出飞天感觉。舞狮元素不仅没有突出,且狮子的形象不够强烈,视觉感不突出。图片和颜色需求匹配度偏低,缺少对称结构美感。换言之,在文生图的能力上,元宝相较友商,短板更加突出。
图源:基于百度AI、即梦AI、元宝、豆包生成图片整理
我们将难度继续升级,选取2024年新课标全国Ⅱ卷的数学高考真题,因这些选择题中不少为多选题,更能考验接入DeepSeek后元宝的数学计算和推理能力。6-11选择题正确选项分别为D\B\C\BC\ABD\AD,但元宝给出的答案分别为B\A\A\C\B\B,整体准确率偏低。甚至某些分析明显存在错误,但元宝仍能自圆其说地给出正确选项。
图源:2024年新课标全国Ⅱ卷
图源:元宝PC
不仅仅是元宝,接入DeepSeek的百度AI在处理数学问题上,能力同样欠佳。其在。6道选择题中仅第7题给出准确答案,其他5道选择题中或答案错误,或无法选择正确答案,或称题目错误。
图源:百度AI
哈尔滨工业大学和华为的研究团队发表的综述论文曾指出,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。该问题的出现,正是大模型在处理数学推理问题时,频频出错的原因。但接入DeepSeek的元宝和百度AI,仍未真正解决模型训练幻觉的问题。换言之,DeepSeek不是厂商提高能力的救命稻草,真正想要提升现有能力,仍需厂商“打铁还需自身硬”。
三、难解的商业化,元宝如何应对?
张明表示,2024年2月虽是农历春节,其所在机构仍收到100条有效新客价值线索,付费转化率能做到50%。但今年2月DeepSeek爆火后,因DeepSeek最大的价值是打破行业有效信息差,帮助用户看到情感中存在的问题,这让市面上情感咨询机构的“套路”被彻底打破。
今年2月,公司新客价值线索暴跌到50条,用户付费转换率更是降低到30%,这让我们只能通过老客户付费来维持生存。但DeepSeek若想完全取代情感咨询机构,恐怕并不现实。比如,客户经历各种情感问题时,很多客户需要的是你真正具有共情能力。但DeepSeek、豆包、ChatGPT、元宝等各种大模型,毕竟是软件,是机器,很难和客户形成深层次的共情能力。张明继续对我们说道。
和张明有着相同感受的也有从事中医行业多年的刘帅(化名),刘帅表示,虽然当前的各种AI大模型能够解读检查报告、根据用户描述和舌苔照片,开出中药方剂。但用户必须把自我症状、舌苔、脉搏等问题描述相当清楚,也必须告诉AI辨证施治问题。只有这样,AI开出的中药方剂才能愈清楚,愈接近老中医用药。
图源:元宝PC版
但考虑到能够准确描述自我病情,懂得如何把脉的患者很少,这意味着AI中医只有和相关机器配合使用才能保证AI中药方剂的准确性。否则,AI开出的中药方剂或多或少都会存在问题。换言之,单纯的AI对话,很难真正做到“对症下药”。
张明和刘帅所说的情况,或许是未来元宝在不同行业探索商业化,遇到不同挑战的缩影。且从移动互联网的商业化路径来看,元宝的商业化同样面临难题。
外卖业务高频、高复购的特性,对不缺资金和流量的互联网大厂来说,以外卖业务形成的高日活和高APP打开率,带动如电商、广告、金融等其他业务。这种通过交叉销售的方式,可实现平台用户最大化价值变现,这既是过去多年来诸多互联网大厂对外卖业务执着,也是京东入局外卖的重要原因。
与之而来的问题是,目前元宝的回复质量,真能让用户对元宝形成高黏性吗?且在广告业务上,元宝仍需在审慎探索中不断前行。 一方面,百度当年因莆田系医疗广告风波深受质疑,AI搜索时代同样为行业敲响警钟。
当前公众号和第三方网站充斥着大量软文推广和营销链接,若元宝在回答用户“如何赚钱”相关问题时,不加甄别地为这些平台引流,可能导致用户接触到风险项目,甚至遭受经济损失。这不仅可能损害用户利益,还会严重影响元宝的公信力和长期用户信任。
另一方面,在“好物推荐”类回复中,AI 生成的“种草”内容若直接引流至微信小店或其他电商平台,可能加重用户对广告内容的疲劳感。面对大量商业化推荐,用户容易产生抵触情绪,甚至对元宝的推荐机制失去信任,最终导致难以挽回的用户流失。
疯狂投流虽能短期获取用户增长,但现阶段元宝在诸多方面仍存在短板。面对现有短板问题,腾讯又要如何快速补齐,进而让用户真正愿意使用元宝,并对元宝产生较高依赖呢?这恐怕不仅仅是腾讯需思考的问题,更是当前大模型厂商需直面的问题。