4月29日,蚂蚁集团旗下百灵大模型宣布Ling-2.6-flash正式开源。该模型参数量104B、激活参数7.4B,支持BF16、FP8、INT4多精度版本。基于混合线性架构,其在4卡H20上推理速度达340 tokens/s,Token消耗仅为同类模型约1/10。优化重点包括中英文自然切换、主流编程框架适配,及Agent场景下的工具调用与多步规划能力。模型已上线Hugging Face与ModelScope平台。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
4月29日,蚂蚁集团旗下百灵大模型宣布Ling-2.6-flash正式开源。该模型参数量104B、激活参数7.4B,支持BF16、FP8、INT4多精度版本。基于混合线性架构,其在4卡H20上推理速度达340 tokens/s,Token消耗仅为同类模型约1/10。优化重点包括中英文自然切换、主流编程框架适配,及Agent场景下的工具调用与多步规划能力。模型已上线Hugging Face与ModelScope平台。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。