IBM发布轻量级视觉语言模型Granite-Docling- DoNews

DoNews > 公司新闻 > IBM发布轻量级视觉语言模型Granite-Docling

IBM发布轻量级视觉语言模型Granite-Docling

推荐 2025-09-20 20:53:02

IBM已正式发布小型视觉语言模型Granite-Docling-258M，定位端到端文件转换场景，采用Apache 2.0开源协议，已在Hugging Face上线。

该模型参数量为2.58亿，专为文档表格处理设计，可完整保留版面、表格、数学公式、列表和代码块等结构，识别准确度高于传统OCR软件。

核心技术支持为DocTags，由IBM Research研发，是一种通用文件结构标记语言，能精确描述页面元素的类型、坐标、阅读顺序及跨元素关系，实现内容与版面分离，并支持“先识别元素范围再执行OCR”的处理流程。

完成转换后，DocTags可将输出导出为Markdown、JSON、HTML等格式，或进一步由Docling库处理。

当前模型支持中文、阿拉伯语和日语，尚未达到企业级水准。IBM表示未来将扩展语言覆盖范围，提升模型可靠性，增强DocTags与watsonx.ai的兼容性，并计划将DocTags词汇表纳入Granite分词器及训练流程。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

富途证券、老虎证券进一步关闭中国内地居民开户通道富途、老虎证券调整内地居民开户政策，现需海外永居身份或非内地身份证件，系统升级中暂仅支持港澳身份证开户。

DeepSeek升级至V3.1-Terminus版本，改进语言一致性 DeepSeek-V3.1-Terminus上线，支持128k上下文，优化语言一致性和Agent能力，分思考与非思考模式，明确输入输出定价。

博泰车联开启招股：拟9月30日上市博泰车联2025年9月22日启动港股招股，发行价102.23港元，拟募资约10.67亿港元，获地平线等基石投资4.66亿港元，9月30日上市，市值达153.34亿港元。

网络安全公司Netskope纳斯达克上市：市值94亿美元 Netskope以19美元发行价在纳斯达克上市，募资9亿美元，股价较发行价涨30%，市值达94.37亿美元，年营收5.38亿美元，净亏损扩大至3.55亿美元。

电商加速平台Pattern纳斯达克上市：市值28亿美元 Pattern Group在纳斯达克上市，发行价14美元，募资3亿美元，市值达27.51亿美元，主要通过亚马逊销售品牌产品。

中山大洋电机冲刺港股：上半年营收121亿元大洋电机拟港交所上市，2022至2024年营收及利润持续增长，2025年上半年业绩同比显著提升。

性价比就是硬道理，10-15万纯电家轿市场洗牌 10-15万纯电家轿市场洗牌

《赴山海》口碑崩后成毅火提新项目，演员扛剧逻辑变了？扛剧之争出现高端玩法，“单人过会”才显硬实力。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号