SuperCLUE工业大模型榜单出炉，这家“AI新国企”国产大模型取得重大突破- DoNews

7月24日，国内权威第三方评测机构SuperCLUE发布中文原生工业大模型测评基准 SC-Industry（SuperCLUE-Industry）最新榜单。榜单显示，国产大模型整体表现亮眼。其中，北电数智的骄阳·工业大模型以83.44 分的总分强势登顶，领先Hunyuan-T1、Kimi K2、o4 mini等国内外主流大模型。

SuperCLUE 是行业权威的通用大模型综合性测评基准，专注于中文大模型测评；SC-Industry立足中文语义环境与工业场景，充分贴合国内制造业的术语体系与应用需求，全面地衡量工业大模型除知识库之外解决行业具体问题的应用能力，兼具工业领域模型的通用性与可拓展性。

据了解，SC-Industry评测从基础能力和应用能力两大维度出发，聚焦工业常规问答、工业数据分析、工业文档问答、工业智能体Agent、工业理解计算、工业代码生成六大能力，对大模型进行效果评估。通过构建专用测评集，SC-Industry结合评估流程、评估标准、评分规则，将文本输入送入超级模型，并对每一维度的评估结果与人类一致性进行分析。这种基于客观科学方法论的高标准测评体系，不仅体现了评估结果的权威性，更凸显出北电数智骄阳·工业大模型在能力上的领先优势。

根据榜单测评结果，骄阳·工业大模型在整体总分第一之外，“应用能力”综合测评结果获90.07分，同样位居榜首。在“工业数据分析”细分维度上，「骄阳」获得90.38的最高分，能够对表格类数据进行出色分析并提供深刻洞察。在“工业智能体Agent”上，骄阳·工业大模型以89.97分领跑，其在一定的工业环境中展现出强大的自主或半自主执行任务能力，能有效做出决策，并与其他系统进行交互以优化或辅助工业流程，特别是在多轮任务规划与工具调用中表现卓越，这对于复杂工业流程的落地至关重要。

SuperCLUE在报告中指出，产业级应用能力成为新分水岭。骄阳·工业大模型凭借在工业数据分析上的强势表现，得到了业界领先的 90.07 分，首次登顶。这一方面说明在工业任务能力方面，国产模型正在突围；另一方面表明在基础能力趋同的情况下，工业数据分析与智能体表现将成为拉开差距的关键。

分析来看，北电数智骄阳·工业大模型此次榜单登顶既出人意料，但又是“必然结果”。出人意料的是，作为“AI新国企”一款还未发布的大模型，骄阳·工业大模型竟然能在国内外一众代表性大模型中脱颖而出；预料之内的是，骄阳·工业大模型能力足够优秀，比如凭借在工业数据分析上的强势表现，其得到了业界领先的90.1 分，首次登顶。这一方面说明在的工业任务能力方面，国产模型正在突围；另一方面表明在基础能力趋同的情况下，工业数据分析与智能体表现将成为拉开差距的关键。

在即将到来的2025 WAIC世界人工智能大会上，北电数智将正式发布骄阳·工业大模型，并聚焦工业企业最关注的“AI+生产、AI+产品、AI+运营、AI+基础设施”等核心业务场景，分享北电数智的创新能力和标杆实践，大家不妨共同期待。

声明：本站转载此文目的在于传递更多信息，并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容,本网站对此声明具有最终解释权。