Qwen3-Next-80B模型以仅激活30亿参数实现接近32B密集模型的性能,训练成本降低至十分之一以下,长上下文推理吞吐提升超十倍。该模型原生支持262K上下文,可扩展至约百万tokens,部分评测表现接近或超越业界先进模型。
模型已通过Hugging Face开源,支持多种框架部署。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
Qwen3-Next-80B模型以仅激活30亿参数实现接近32B密集模型的性能,训练成本降低至十分之一以下,长上下文推理吞吐提升超十倍。该模型原生支持262K上下文,可扩展至约百万tokens,部分评测表现接近或超越业界先进模型。
模型已通过Hugging Face开源,支持多种框架部署。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。