Mistral AI开源Voxtral语音模型 低成本高精度支持多语言

Mistral AI近日发布开源语音理解模型Voxtral系列,该系列基于Mistral Small 3.1开发,包含Voxtral Small(24B)和Voxtral Mini(3B)两个版本,分别针对生产环境和本地/边缘部署优化,另提供仅支持语音转文字的Voxtral Mini Transcribe。

Voxtral支持32K Token上下文长度,可处理30分钟音频转录或40分钟音频理解任务,具备生成结构化摘要和提问能力,兼容英语、法语、西班牙语等印欧语系多语种。官方测试显示,Voxtral Mini Transcribe成本仅为OpenAI Whisper的一半且性能更优;Voxtral Small在高级用例中表现接近ElevenLabs Scribe,价格优势显著。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1