2026年4月22日,蚂蚁集团百灵大模型正式发布Instruct模型Ling-2.6-flash。该模型总参数104B、激活参数7.4B,此前以匿名版本Elephant Alpha在OpenRouter上线并连续多日登顶Trending榜,日均调用量达100B tokens。新模型主打推理效率、Token效率与Agent场景适配,实测推理速度达340 tokens/s,Token消耗仅为同类模型约1/10。即日起开放一周免费API调用,后续按量计费,并计划开源BF16/FP8/INT4版本。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



