北京亿安天下科技股份有限公司基于离网算力服务器的大模型推理调度方法专利获授权(服务器调度专利快讯)

天眼查App显示,2025年5月20日,「基于离网算力服务器的大模型推理调度方法」正式进入专利权的授权阶段。申请人为北京亿安天下科技股份有限公司,该项服务器调度技术领域专利涉及离网环境下大模型推理任务的高效计算和资源利用最大化。据专利信息显示,该方法通过建模任务需求和服务器资源,结合实时监测和优化调度,实现了显著优化的效果。发明人为李红明、苏浩。 「本发明涉及服务器调度技术领域,公开了基于离网算力服务器的大模型推理调度方法,包括以下步骤:收集离网算力服务器的硬件信息,构建服务器资源向量;将大模型推理任务分解为多个子任务,构建任务建模;根据离网服务器的硬件信息和任务依赖关系,利用优化方法进行任务划分;基于服务器当前的负载状态,对子任务进行动态任务调度;根据服务器的实时计算负载,动态迁移部分任务至其他服务器,确保服务器间的负载平衡;执行分配的任务,监测服务器的运行状态和任务完成情况,根据反馈数据动态调整任务分配策略。通过建模任务需求和服务器资源,结合实时监测和优化调度,实现了离网环境下大模型推理的高效计算和资源利用最大化。」

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1