OpenAI发布全球首款千亿级开放权重模型

OpenAI 正式推出 gpt-oss-120b 和 gpt-oss-20b 两款开放权重语言模型,以 Apache 2.0 许可证开源,首次实现开源模型在推理能力、工具使用和硬件适配性上的全面突破。

作为自 2019 年 GPT-2 以来的首款开源模型,gpt-oss-120b(1170 亿参数)在核心推理基准测试中性能接近 OpenAI o4-mini,可在单块 80GB GPU 上高效运行;gpt-oss-20b(210 亿参数)则以 16GB 内存支持边缘设备部署,在常见任务中媲美 o3-mini。两者均采用混合专家(MoE)架构,每 token 仅激活 51 亿和 36 亿参数,通过分组多查询注意力(GQA)和旋转位置编码(RoPE)技术,原生支持 128k 上下文长度,显著降低推理成本。

在工具调用评测中,两款模型在 TauBench 和 HealthBench 上表现超越 OpenAI o1 和 GPT-4o 等专有模型,尤其在医疗问答场景中准确率提升 23%。安全方面,OpenAI 通过对抗性微调测试和外部专家审核,确保模型在生物安全、网络安全等敏感领域的风险可控,其内部安全基准表现与前沿闭源模型持平。

首批合作伙伴 AI Sweden、Orange 和 Snowflake 已开始探索本地化部署:AI Sweden 将模型用于工业数据分析,Orange 计划集成至通信网络优化,Snowflake 则聚焦企业数据隐私保护场景。这一战略举措被业界视为应对 Meta、Mistral 等竞争对手开源攻势的关键布局,标志着 OpenAI 从封闭生态向开放创新的重大转型。

开发者可通过 Hugging Face 下载模型,或结合 Responses API 实现从本地推理到云端部署的灵活选择。OpenAI 表示,此举旨在 “让每个人都能在自有基础设施上运行和定制 AI”,推动生成式技术进入普惠时代。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1