微软推出Phi-4系列推理模型,高效处理复杂任务能力显著提升

微软于4月30日发布Phi-4-reasoning系列推理模型,包括Phi-4-reasoning、Phi-4-reasoning-plus和Phi-4-mini-reasoning三款产品。该系列模型通过监督微调Phi-4,结合OpenAI o3-mini生成的高质量“可教导”提示数据集训练,专为复杂推理任务优化。

微软表示,该系列模型不仅延续了小型模型的高效特性,还在多步骤分解和内部反思能力上实现突破,尤其在数学推理和代理型应用中表现优异。其中,Phi-4-reasoning(140亿参数)和增强版Phi-4-reasoning-plus在数学推理测试中超越多款前沿模型,包括OpenAI o1-mini和DeepSeek-R1-Distill-Llama-70B。

此外,Phi-4-mini-reasoning专为资源有限环境设计,仅3.8亿参数却在多项基准测试中超越更大模型,适合教育应用及边缘设备部署。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1