近日,DeepSeek发布了Janus Pro模型,该模型集成了多模态理解和生成功能,首次采用统一的Transformer架构,突破了传统AIGC模型的限制,实现了理解与生成任务的一体化支持。Janus Pro通过优化训练策略和扩展模型规模,显著提升了文生图等功能的性能与稳定性,并提供了10亿参数和70亿参数两个版本。
英特尔Gaudi 2D AI加速器现已针对Janus Pro模型进行优化,凭借2.45TB/秒的高带宽和96GB HBM大容量内存,为模型提供了强大的计算支持。在生图批处理任务中,随着批量大小的增加,吞吐性能得到显著提升,大幅缩短了任务处理时间。结合英特尔Optimum-Habana框架的优化,Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率,仅需约10秒即可生成16张高质量的图片。开发者仅需调整数行代码,即可实现这一结果,极大降低了开发门槛和迁移成本。
此外,DeepSeek的蒸馏模型在至强和Gaudi平台上也得到了支持,进一步推动了AI应用的落地和规模化发展。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。