IBM发布轻量级文档理解模型Granite-Docling-258M

IBM近日正式推出小型视觉语言模型Granite-Docling-258M,该模型专为文档与表格处理设计,参数量为2.58亿,适用于端到端文件转换场景。基于Apache 2.0开源协议,模型已在Hugging Face上线。其核心技术DocTags由IBM Research研发,可精准标记页面元素类型、位置及阅读顺序,实现内容与版式分离,并支持导出为Markdown、JSON等格式。相比传统OCR,识别准确性更高,能完整保留表格、公式、列表等结构。目前支持中文、阿拉伯语和日语,未来将拓展更多语言并提升稳定性,同时加强与watsonx.ai的兼容性。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1