字节发布豆包视觉理解、3D 生成等新模型，豆包音乐模型可生成 3 分钟作品- DoNews

DoNews > 公司新闻 > 字节发布豆包视觉理解、3D 生成等新模型，豆包音乐模型可生成 3 分钟作品

字节发布豆包视觉理解、3D 生成等新模型，豆包音乐模型可生成 3 分钟作品

IT之家 2024-12-18 11:33:56

IT之家从字节跳动官方获悉，在今日的火山引擎 Force 大会上，字节跳动正式发布豆包视觉理解模型，为企业提供多模态大模型能力。豆包视觉理解模型千 tokens 输入价格仅为 3 厘，一元钱就可处理 284 张 720P 的图片，官方宣称比行业价格便宜 85％。

豆包 3D 生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台 veOmniverse 结合使用，可完成智能训练、数据合成和数字资产制作，官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。

豆包大模型旗下多款产品也迎来了更新：

豆包通用模型 pro：全面对齐 GPT-4o，使用价格仅为后者的 1/8；
音乐模型：可生成 3 分钟的完整作品；
文生图模型 2.1 版本：精准生成汉字、一句话 P 图，已接入即梦 AI 和豆包 App。

此外，豆包将于明年春季推出具备更长视频生成能力的豆包视频生成模型 1.5 版，豆包端到端实时语音模型也将很快上线，从而解锁多角色演绎、方言转换等新能力。

本文转载自IT之家，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请联系IT之家通知我方删除，我方将在收到通知后第一时间删除内容！本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

嘀嗒出行年营收5亿：同比降36% 经调整净利1.4亿降34.6% 嘀嗒出行2025年营收5.02亿元，同比降36.2%；毛利3.33亿元，降41.3%；经调整净利1.38亿元，降34.6%；现金9.67亿元，股价1.29港元。

原小米硬件高管徐睿将成为Meta新组建AI硬件团队负责人徐睿加盟Meta，将领导MSL新成立的AI硬件团队。他历任小米、字节跳动等多家科技公司硬件高管，近期随Dreamer被Meta收购加入。

北汽集团 3 月销量超 18.2 万辆，同比增长 7% 北汽集团3月销量18.2万辆，同比增7%；自主品牌、海外销量分别增19%、47%；极狐、北京越野Q1交付同比增34%、67%。

米哈游创始人向交大捐赠，捐资助力“AI未来基石”基金米哈游联合创始人刘伟代表创始团队向上海交大捐设“AI未来基石”基金，支持AI前沿研究与人才培养，致敬母校130周年。

小鹏回应澳大利亚独家经销商合作破裂小鹏终止澳洲代理TrueEV独家资格，因对方资金断裂、违约订单及信任破裂；法院驳回其禁令申请；小鹏加速构建本地化服务网络，打造可信赖科技品牌。

单依纯，可惜了一个年少成名的歌手的分裂。

霸王茶姬加盟商的狂飙与失速霸王茶姬怎么了。

OpenAI 上市前夕突发人事巨变：COO 莱特卡普调岗 OpenAI高管层调整：莱特卡普转任特别项目，罗奇因癌治疗离岗，西莫因神经免疫病休假；公司推进IPO、1220亿美元融资及商业化。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号