DeepSeek开源V3.1-Base模型,上下文长度提升至128K

DeepSeek于昨日深夜在Hugging Face平台开源其最新模型V3.1-Base,该模型将上下文长度扩展至128K,参数规模约为685B,展现出更强的长文本处理能力。此前,DeepSeek已宣布线上模型升级至V3.1版本,用户可通过官方网页、App及小程序体验更新内容,API调用方式维持不变。值得注意的是,备受关注的DeepSeek R2版本尚未公布具体发布时间,仍需进一步等待。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1