阿里巴巴发布轻量级多模态模型 Qwen2.5-Omni-3B,性能接近旗舰版

阿里巴巴 Qwen 团队持续深耕 AI 领域,继 3 月推出 Qwen2.5-Omni-7B 后,于 4 月 30 日发布了其轻量版本 Qwen2.5-Omni-3B。该模型参数规模缩减至 3B,专为消费级硬件设计,但仍保留了 7B 模型 90% 以上的多模态性能。在视频理解与语音生成等任务中,其表现接近旗舰版本。

新模型在内存优化上实现重大突破,处理 25,000 token 的长上下文输入时,VRAM 占用从 60.2 GB 降至 28.2 GB,降幅达 53%。这意味着它可在 24GB GPU 上运行,大幅降低硬件门槛。通过 Thinker-Talker 架构及 FlashAttention 2 等技术,Qwen2.5-Omni-3B 在速度与能耗上进一步提升。

目前,该模型仅限研究用途,企业如需商用需单独获取许可,适合测试与原型开发场景。用户可从 Hugging Face 平台下载体验。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1