AMD、高通宣布硬件支持 OpenAI gpt-oss 系列模型

OpenAI 当地时间昨日以 Apache 2.0 许可证推出两款 gpt-oss 系列开放推理模型,参数规模较小的 gpt-oss-20b 可在配备 16GB 内存的边缘设备运行,参数更多的 gpt-oss-120b 能在单个 80GB GPU 上高效运行。

AMD 与高通均宣布旗下硬件支持 gpt-oss 系列模型。AMD 锐龙 AI Max+ 395 处理器支持 gpt-oss-120b,AMD Radeon RX 9070 16GB 显卡支持 gpt-oss-20b,高通旗舰骁龙平台亦支持 gpt-oss-20b。

AMD 表示锐龙 AI Max+ 395 是全球首款能运行 gpt-oss-120b 的消费级 AI PC 处理器,采用 GGML 框架转换的 MXFP4 格式 gpt-oss-120b 大约需要 61GB 显存,而 "Strix Halo" 平台在 128GB 统一内存下支持将 96GB 分配给 GPU,满足运行需求。

锐龙 AI Max+ 395 在 gpt-oss-120b 上输出速率达 30 Token / s,并支持该模型的 MCP 模型上下文协议实现。

Radeon RX 9070 16GB 显卡则在 gpt-oss-20b 上实现出色的首 Token 输出时间(TTFT)和每秒 Token 输出数量表现。

高通表示根据早期测试,gpt-oss-20b 可在端侧实现出色思维链推理表现,开发者可通过 Hugging Face 和 Ollama 等平台在搭载骁龙芯片的设备上访问并运行该模型。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1