快科技1月28日消息,爆火的国产大模型DeepSeek又放大招,今天凌晨突然发布Janus-Pro多模态大模型,进军文生图领域。
在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E 3,还击败了Stable Diffusion、Emu3-Gen等热门模型。
Janus Pro采用MIT开源协议,这意味着可无限制用于商业场景。
DeepSeek方面表示,该大模型是2024年11月13日发布的JanusFlow大模型的高级版本。
相比前代模型,Janus-Pro优化训练策略、扩展了训练数据,模型也更大。
得益于此,Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面取得重大进步,同时还增强了文本到图像生成稳定性。
虽然Janus-Pro暂时只能处理384x384分辨率的图像,但考虑到模型如此“紧凑”却能达到如此水准,足以令人惊艳。
作为多模态模型,Janus-Pro不仅能文生图,还能对图片进行描述,识别地标景点,识别图像中的文字,并能对图片中的知识进行介绍。
本文转载自快科技,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系快科技通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。