4月23日,腾讯正式发布Hy3 preview大模型。该模型为混元团队经历重组、架构重构及由首席AI科学家姚顺雨牵头关键团队后推出的首份成果。
官方信息显示,Hy3 preview总参数量295B,激活参数21B,支持256K上下文,采用快慢思考融合的MoE架构,定位为“解决真实世界复杂工程问题”。
实测围绕三项核心能力展开:UI设计与动效生成、多源信证内容核实、基于未知文档的上下文学习(CL-Bench范式)、以及Agent级工具调用能力。
在个人展示页任务中,模型生成具备现代艺术感与交互动效的网页,未呈现典型AI生成痕迹;在鱼油功效核实任务中,模型调取央视、腾讯新闻、澎湃、FTC执法记录、Nature/Scientific Reports、PubMed及Cochrane共7类信源,区分不同人群给出健康人群35分、心血管患者65分的信度评分,并识别出直播间虚假宣传与BASF赞助试验无效等市场信息污染现象。
在CL-Bench风格测试中,模型基于虚构《Helios-7压缩机组操作手册》第4.3节条款,准确判断主轴承温度84°C超限须立即停机,未以工程常识覆盖文档规则;其回答中虽出现思维链独白,但结论严格依据文档推导,未发生“读到但用错”错误。
Agent测试中,模型在workbuddy环境下完成世界杯赛程网页制作任务,调用浏览器与腾讯在线文档Skill,执行32次工具调用;其能主动识别Chrome远程调试未就绪并暂停流程,亦能在环境被打断后切换策略完成多模态输出。
腾讯方面表示,Hy3 preview是混元大模型重建的第一步,旨在通过开源获取社区反馈以提升实用性;同时持续扩大预训练与强化学习规模,并推进与腾讯各产品的深度Co-Design,提升真实场景综合表现及特色能力探索。
据披露,Hy3系列更大尺寸模型后续将陆续发布。当前Hy3 preview未追求单项SOTA,而是填补腾讯自研基座能力缺口,使其AI产品线首次具备全面依赖自家大模型的技术基础。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



