字节跳动豆包视频生成大模型发布:支持多风格多比例的一致性多镜头生成

字节跳动火山引擎正式发布豆包视频生成大模型,支持高效的 DiT 融合计算单元、全新设计的扩散模型训练方法和深度优化的 Transformer 结构,可以实现更充分地压缩编码视频与文本,支持一致性多镜头生成,能够大幅提升视频生成的泛化能力。

火山引擎总裁谭待表示,豆包视频生成大模型支持多风格多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域。

此外,谭待表示,豆包大模型发布以来,使用量爆发式增长。豆包大模型日均 tokens 使用量超过 1.3 万亿,日均生成图片 5000 万张,日均处理语音 85 万小时。

本文转载自IT之家,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系IT之家通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1