百灵发布Ling-2.6-flash大模型:104B参数,聚焦推理与Token效率

2026年4月22日,蚂蚁集团百灵大模型正式发布Instruct模型Ling-2.6-flash。该模型总参数104B、激活参数7.4B,此前以匿名版本Elephant Alpha在OpenRouter上线并连续多日登顶Trending榜,日均调用量达100B tokens。新模型主打推理效率、Token效率与Agent场景适配,实测推理速度达340 tokens/s,Token消耗仅为同类模型约1/10。即日起开放一周免费API调用,后续按量计费,并计划开源BF16/FP8/INT4版本。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1