火山引擎发布豆包1.5视觉深度思考模型多模态能力达业界领先水平- DoNews快讯

DoNews > 快讯 > 火山引擎发布豆包1.5视觉深度思考模型多模态能力达业界领先水平

火山引擎发布豆包1.5视觉深度思考模型多模态能力达业界领先水平

2025-05-13 16:00:02

534100

在FORCE LINK AI创新巡展上海站上，火山引擎正式推出豆包1.5・视觉深度思考模型。该模型凭借仅20B的激活参数，在60个公开评测基准中斩获38项SOTA成绩，展现出卓越的多模态理解与推理能力。

该模型创新性地采用动态帧率采样技术，显著提升了视频时序定位精度，配合向量搜索功能，可实现视频内容的精准检索与分析。通过数万亿多模态数据训练，模型还具备深度视觉思考能力，能自主完成假设推理与验证的完整认知闭环。

特别引人注目的是其新增的GUI Agent功能，可跨平台执行App自动化检测等复杂交互任务。目前该模型已在火山方舟平台上线，并在字节跳动多款产品测试中投入实际应用。

索尼 2024 财年净利润 1.14 万亿日元同比增长 18% 创历史新高 PS5 累计出货 7780 万台。

Soul App Z世代婚姻登记态度调研：领证是仪式感里程碑 91.2%的年轻人坚持法律保障。

Galaxy S25 Edge 发布；华为鸿蒙新品发布会定档；外卖平台企业被五部门约谈｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

传奇生物Q1营收同比增长107.5% CARVYKTI销售保持强劲增长高于预期。

DJI Mavic 4 Pro究竟如何重新定义旗舰？ DJI Mavic 4 Pro究竟如何重新定义旗舰？

虎牙2025年Q1财报：总收入15.1亿元企稳攀升。

京东物流 2025 年第一季度收入 469.67 亿元同比增长 11.5%。

京东发布 Q1 财报：收入达 3011 亿元，同比增长 15.8% 超预期。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号