WAIC观察 | “旧趋势”退场，大模型称王- DoNews

撰文：李信马

图源：WAIC

为期3天的世界人工智能大会（WAIC）落下了帷幕，据官方统计，截止到7月8日下午3点，大会的专业观众到场总人次达到17.7万，全网曝光量达到64.1亿次，项目投资总额达到288亿元。

相比去年，今年的WAIC到场人数大幅增长（去年线下仅有3 万人参会），这其中也有场地增加的原因，今年WAIC在上海世博中心和世博展览馆之外，还新设了徐汇、张江、闵行以及上海世博酒店等分会场，有超过400家企业参展，几乎是去年参展企业数量的两倍。

而在生成式AI的热度持续近半年后，观众们的热情也被彻底引燃，会场外，排着长达百米的队伍，会场内，也是摩肩接踵。甚至连会场周边的咖啡馆，都挤满了聊天的参会者。

如果找一个词来概括这届WAIC大会，那一定是“大模型”，本届WAIC的主题就是“智联世界生成未来”。

走在大会的展区中，每个人都能明显感受到，人工智能发展趋势的变化。比如上一届，WAIC的主题是“智联世界元生无界”，但是当时的热点趋势“元宇宙”，在本届WAIC上，风头已经完全被大模型抢走；另一个稍显落寞的趋势就是“自动驾驶”，2021年的WAIC上，图森未来、嬴彻科技和小马智行来三家自动驾驶企业，曾在H1馆相邻的展区上，各自摆上自家的大型卡车，而在今年的H1馆中，三家中却只剩下图森未来了，和自动驾驶相关的演讲和论坛，也基本转移到了张江分会场；至于机器视觉，早在2021年，被称为“AI四小龙”的商汤、旷视、依图和云从，就只有商汤还在参会。

相对来说还坚挺的是“机器人”，开幕式上，受邀演讲的马斯克大谈特斯拉机器人的进展，会场中特斯拉展位上的机器人，也受到了观众的欢迎，参展企业中，带着人型机器人、机器狗、清洁机器人、物流机器人来参会的也不在少数。

图片来源：WAIC

除了参展企业的变化，企业所努力展示的内容，也都在明显向大模型靠拢。比如机器视觉起家的商汤，本次大会上最重要的发布，是宣布“日日新”大模型全面升级；在多个人工智能领域都有所建树的百度，在其参会的全体论坛和五个分论坛中，五个与大模型内容强相关，只有最后一个是智能驾驶分论坛；专注于AI决策领域的第四范式，也在WAIC上带来了他们的“式说”大模型，并首次公开展示。

此外，本次WAIC还出现了为数不少的芯片和算力展区，比如华为云、燧原科技、还有百度的昆仑芯，同样是和大模型紧密相连。

据统计，本届WAIC，企业带来的大模型总数已经超过了30个，不久前发布的《中国人工智能大模型地图研究报告》曾统计中国参数在 10 亿规模以上的大模型已发布了 79 个，以这个速度推测，破百就在不久后。

如此多的大模型同台竞技，很难不让人产生“乱花渐欲迷人眼”的感觉，而且参展企业，也是不约而同地展示了与AI聊天对话或是“文生图”这些大模型基操，不禁让人觉得有些审美疲劳，久违地回忆起了曾经中国互联网的“野蛮生长”。考虑到目前还没有规模化应用的大模型，眼下的情形，就像是几十个车厂都推出了概念车，却没有一个能量产的。

在7月7日，中国信通院发布了《2023大模型和AIGC产业图谱》，将大模型和AIGC产业链上下游进行了梳理，分成了行业应用、产品服务、模型与工具和基础层四个主要部分。

图片来源：中国信通院

而具体到大模型（算法模型），则分成了两大类：通用大模型和垂类大模型。简单来理解，通用大模型是具有大规模参数体量的大模型，是基础设施，但不解决行业具体问题；而垂类大模型是在开源大模型的基础上，针对垂直行业进行大模型建设和应用。

图片来源：中国信通院

但即使在同一大类中，大模型也是有各自的路线和特点。本届WAIC评选出了9大“镇馆之宝”，唯一入选的大模型就是百度的文心一言。作为国产大模型的领头羊，目前文心大模型已经升级到3.5版本，百度首席技术官王海峰表示，相比之前模型的效果提升了50%，训练速度提升2倍，推理速度提升30倍，未来还将发布更多的百度官方和第三方插件，同时逐步开放插件生态。

有趣的是，百度还特意将总部的专利墙在展台复制了一面，仿佛在宣示“我的技术最强”，考虑到百度已经连续五年AI专利申请和授予量全国第一，似乎也没什么不对。

同样受到热捧的还有阿里云的通义千问，会上，阿里云发布了AI绘画创作大模型通义万相，并开启定向邀测。不过，更多被提到的是MaaS（Model as a Service，模型即服务）理念，在开发者生态层，阿里发起的大模型开源社区——魔搭，目前集聚了180多万AI开发者和900多个优质AI模型。这个社区，就像一个开源的大模型集市，据阿里云称，目前模型贡献者基本覆盖国内大模型赛道核心玩家，如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技等，贡献了30多个10亿以上参数规模大模型。用阿里云CTO周靖人的话来说：“把促进中国大模型生态的繁荣作为首要目标。”

图片来源：阿里云

大模型领域的另一个重要玩家——华为云，在发布盘古大模型3.0的同时，仿佛群嘲一般喊出了“盘古大模型不作诗、只做事”。而且与其他大模型不同，盘古大模型3.0包括“5+N+X”三层架构，L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型；L1层是N个行业大模型，既可以提供使用行业公开数据训练的行业通用大模型，也可以基于行业客户的自有数据训练专有大模型；L2层则提供了更多细化场景的模型，比如政务热线、网点助手、先导药物筛选、传送带异物检测等。

不难发现，盘古大模型既包涵通用大模型，也包含垂类大模型，甚至中小模型也囊括在内。而另一重要发布——昇腾AI云服务，单集群提供2000P Flops算力，明显是想做大模型的“卖水人”。华为可能不想写诗，但大模型ToB（企业级服务）的钱，却很想赚到。

同样作为国内顶级的互联网公司，腾讯的大模型却被划分到了垂类大模型中，似乎有点“不思进取”。不过，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在演讲中明确表示，对企业来说，基于行业大模型，构建自己的专属模型，是更优的选项。

“通用大模型可以在100个场景中，解决70%-80%的问题，但未必能100%满足企业某个场景的需求。”汤道生说。和阿里云类似，腾讯云最近也公布了MaaS服务全景图，推出了基于腾讯云TI平台的行业大模型精选商店，提供10大行业，50多个解决方案，还有行业大模型精调解决方案。

比起聊天、作图等应用，ToB的钱显然更吸引大模型厂商。虽然技术还在不断迭代中，但厂商已经做好了行业化和商业化的准备。这一机会，即使体量较小的厂商也不肯放过，只是大厂有实力做通用大模型，乃至像华为一样上下游通吃，而有的厂商更倾向于直接做垂类的行业大模型。比如第四范式的“式说”，同样是定位为ToB领域的多模态大模型，在零售门店管理、房产中介、等细分场景已经有了初步的落地。

不过，目前还有两个问题在限制大模型的发展，其一是成本，即使是行业或专属大模型，也需要至少千万以往的预算，大模型距离普及还有较远的距离。其次，对大模型安全性的担忧，正如清华大学人工智能研究院名誉院长、中国科学院院士张钹在WAIC论坛上时表示的，现在的人工智能技术是不安全的，不可靠的，也是不可信的。

如何保证大模型安全、好用，成本还低廉，这是近百个大模型未来真正需要解决的问题。希望明年的WAIC上，我们能看到大模型发展的答案，而不是变成又一个“黯淡的旧趋势”。