腾讯蒋杰：混元大模型已在沟通、生产、科技普惠多个场景落地- DoNews

DoNews11月9日消息，“腾讯正在持续探索大模型应用场景，目前内部超180项业务已经接入腾讯混元大模型进行内测”，11月9日，腾讯集团副总裁蒋杰在2023年世界互联网大会乌镇峰会上表示。

腾讯集团副总裁蒋杰

作为腾讯全链路自研的实用级大模型，自2023年9月首次面向公众亮相以来，腾讯混元大模型在内部业务的应用不断深化，同时在文化沟通、生产提效、科技普惠多个领域探索落地场景，发掘应用价值。

在文化沟通方面，腾讯混元大模型的多语种翻译以及最新的文生图、文生3D等能力，可以有效增进沟通，帮助跨文化背景的人更好地交流。例如，通过腾讯混元，人们可以便捷地使用英文和法语等语言，向外国朋友介绍汉服的历史和特征，辅以AI生成的图片，以及3D立体的呈现，让整个介绍和沟通更准确、生动，更高效。

在生产效率方面，腾讯混元大模型应用在专业设计场景中，可显著提升素材创作生产效率。据介绍，当前腾讯内部各类设计需求中，90%的角色、场景、地图等原画创作都可由腾讯混元辅助生成。

同时，基于腾讯混元的能力，超过99%的logo可以通过AI设计。在广告业务中，通过腾讯混元“文生图”，可以高效创作广告素材，让创作效率提升10倍以上，在提供更多创意素材的同时降低设计成本。

在科技普惠方面，腾讯混元大模型正在通过强大的知识储备能力服务对应场景，例如，在医疗领域，大模型可以成为医生的小助手，通过智能导诊迅速了解患者需求，帮助他们找到合适科室或者其他专业的医疗服务。

此外，借助大模型丰富的医学知识，可以为医生和患者提供医疗问答支持，答疑解惑。未来随着图像处理能力的加入，大模型还可协助识别各类医学影像，成为放射科医生的助手。

现场，蒋杰也展示了腾讯混元大模型的“文生视频”能力，围绕“全球沟通纽带”、“连接、高效与共享”、“一带一路”等关键词，腾讯混元大模型生成了一段体现全球人类友好交往主题的视频，包含高铁、广州塔、机器人、汉服等多个画面，展示了领先的视频生成技术水平。通过大模型来生成视频画面，可以大大降低创作门槛，未来，这一技术也有望被广泛应用在跨文化沟通、生产提效以及科技普惠各个领域，带来新的应用和想象空间。

长期以来，腾讯坚持“技术为应用服务”的理念，以技术创新为核心动力，通过融合场景推动人工智能的研究与实践，不断将人工智能技术运用到不同场景中，促进社会发展。

蒋杰介绍，腾讯在人工智能领域深耕多年，建立了四大AI实验室，涉及从全面基础研究到多种应用开发多个环节，同时还建立了前沿科技探索的实验室矩阵，涵盖机器人、量子计算、生命科学等，打造面向未来的“科技引擎”。

在人工智能领域，腾讯拥有丰富的积累。2011年，腾讯已开启语音领域探索，在语音识别、语音合成、声纹识别方面有所突破。2012年起，腾讯开展图像识别研究，将相关成果广泛应用到各行业中，最近，腾讯还推出“刷掌支付”，基于自研的掌纹特征提取与识别技术，增加了支付方式的选择。

此外，2016年开始，腾讯在强化学习与智能决策方向不断取得突破，在国际顶级学术会议发表多篇论文，并将成果应用于游戏AI、医疗和机器人等多个领域。2021年开始，腾讯相继推出了千亿和万亿参数的NLP大模型。2023年9月7日，腾讯混元大模型正式对外亮相，拥有更强大的文本能力及多模态理解和生成能力。

腾讯混元大模型已具备成为数字引擎的关键能力，2023年恰逢乌镇互联网峰会十周年，也是“一带一路”倡议提出十周年，蒋杰表示，人工智能技术具有无限潜力。