阿里开源Qwen3-Embedding系列模型,助力文本表征与检索新突破

今日凌晨,阿里巴巴正式开源Qwen3-Embedding系列模型,专为文本表征、检索与排序任务设计。该系列基于Qwen3基础模型训练,在多项基准测试中展现出卓越性能。其中,8B参数规模的Embedding模型以70.58的得分在MTEB多语言榜单中排名第一,超越众多商业服务。

Qwen3-Embedding系列具备强大的泛化能力和灵活架构,提供从0.6B到8B参数的三种配置,满足不同场景需求。支持表征维度自定义及指令适配优化,有效降低应用成本并提升特定任务性能。同时,该系列支持超100种语言,涵盖自然语言与编程语言,具备出色的多语言处理能力。

模型通过「EOS」标记提取语义向量,并利用单塔结构计算文本相关性得分,为开发者提供了高效、易用的解决方案。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1