OpenAI发布全球首款千亿级开放权重模型- DoNews

OpenAI 正式推出 gpt-oss-120b 和 gpt-oss-20b 两款开放权重语言模型，以 Apache 2.0 许可证开源，首次实现开源模型在推理能力、工具使用和硬件适配性上的全面突破。

作为自 2019 年 GPT-2 以来的首款开源模型，gpt-oss-120b（1170 亿参数）在核心推理基准测试中性能接近 OpenAI o4-mini，可在单块 80GB GPU 上高效运行；gpt-oss-20b（210 亿参数）则以 16GB 内存支持边缘设备部署，在常见任务中媲美 o3-mini。两者均采用混合专家（MoE）架构，每 token 仅激活 51 亿和 36 亿参数，通过分组多查询注意力（GQA）和旋转位置编码（RoPE）技术，原生支持 128k 上下文长度，显著降低推理成本。

在工具调用评测中，两款模型在 TauBench 和 HealthBench 上表现超越 OpenAI o1 和 GPT-4o 等专有模型，尤其在医疗问答场景中准确率提升 23%。安全方面，OpenAI 通过对抗性微调测试和外部专家审核，确保模型在生物安全、网络安全等敏感领域的风险可控，其内部安全基准表现与前沿闭源模型持平。

首批合作伙伴 AI Sweden、Orange 和 Snowflake 已开始探索本地化部署：AI Sweden 将模型用于工业数据分析，Orange 计划集成至通信网络优化，Snowflake 则聚焦企业数据隐私保护场景。这一战略举措被业界视为应对 Meta、Mistral 等竞争对手开源攻势的关键布局，标志着 OpenAI 从封闭生态向开放创新的重大转型。

开发者可通过 Hugging Face 下载模型，或结合 Responses API 实现从本地推理到云端部署的灵活选择。OpenAI 表示，此举旨在 “让每个人都能在自有基础设施上运行和定制 AI”，推动生成式技术进入普惠时代。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。