GPU计算云服务商CloudRift近日证实,部分搭载GeForce RTX 5090和RTX PRO 6000显卡的节点出现可复现的虚拟化故障,导致显卡完全无响应,需重启整个系统才可恢复。该问题多发生于虚拟机运行数日后或系统启停过程中。
CloudRift表示已排除IOMMU配置、内核版本及驱动绑定等常见问题,同期运行的H100s、B200s及旧款RTX 4090均未出现异常。据用户反馈,类似故障也在Proxmox论坛和Level1Techs社区被报告,表现为虚拟机停止后系统挂起、GPU无法重新初始化。
目前英伟达尚未公开发声,但已有用户表示官方已能复现该问题。CloudRift承诺对提供有效解决方案或协助定位根本原因者给予1000美元奖励。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。