天眼查App显示,2025年8月19日,「自动驾驶场景的语义分割交互标注方法及相关装置」专利正式进入专利权的授权阶段。申请人为新石器慧通(北京)科技有限公司,该项人工智能专利涉及自动驾驶技术中的图像语义分割与交互标注场景。据专利信息显示,该技术无需庞大的分类数据集,仅通过添加分类分支即可在开源算法基础上微调自己的数据集,显著优化了现有技术中串联SAM模型和分类模型存在的分类参数过大、推理速度过慢、对机器配置要求过高的问题。发明人为许鑫、张雄、杨城。本申请公开了一种方法,包括获取图像嵌入和提示嵌入;将提示嵌入和初始化的预测令牌拼接,得到令牌嵌入;将令牌嵌入与图像嵌入组成映射输入transformer模块中,通过多头注意力机制更新令牌嵌入并融合提示嵌入和图像嵌入,生成上下文感知的中间表示;将更新后的掩码令牌输入分类头中,预测掩码令牌对应掩码的感兴趣区域的目标类型。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。