8月26日,由长三角人工智能党建联盟主办,上海市人工智能技术协会协办的“2021长三角计算机视觉技术和应用创新论坛”在上海如期举行。
此次论坛聚焦人工智能“计算机视觉”核心技术在技术突破及市场应用等方面的相关议题,并邀请了众多人工智能领域的资深专家、行业分析师、企业高管,把脉行业未来发展趋势,分享最前沿的行业技术。
作为AI数据训练服务代表企业云测数据受邀参会,云测数据总经理贾宇航进行了以《数据标注行业的发展助推计算机视觉落地应用》的主题分享。与此同时,云测数据作为参编单位全程参与编撰《人工智能基础数据服务白皮书(2021年)》也在会上正式对外发布。
随着计算机视觉技术(Computer Vision,CV)的不断发展,应用场景愈发的细分化、专业化。小到手机刷脸支付、一键美颜、拍照识图等应用,大到智慧城市、自动驾驶、智能家居、智慧医疗等多种场景行业市场,计算机视觉技术正在全面商业化落地。
在这其中,丰富的、精准的训练数据是算法研究的保障和基石,数据质量的高低直接决定最终模型效果的好坏,换句话说,数据对于模型性能的贡献是很重要的,数据越丰富、种类越多、模型效果越好,算法的泛化性和鲁棒性就越强。
云测数据总经理贾宇航认为,由于计算机视觉技术商业化落地进程的加快,算法对训练数据提出了更高要求,训练数据主要有三大发展趋势:
第一,训练数据的内容专业化。目前AI正在走向细分领域,对于落地场景的定义、对于具体训练数据的规则定义需要明确且专业的规范,对应的训练数据的采集与标注,需要有相应的专业知识能力,最终计算机视觉产品落地需要计算机视觉科学家与产业专家共同推进;
第二,训练数据的多维化。随着技术和行业的发展,多维度的数据融合正加速场景落地,多维度数据采集硬件的差异性也在逐步凸显。以智能驾驶领域数据需求为例,业界已逐渐从单摄像头过渡到多摄像头的方案。但是2D图像对于物体的测距仍有着很大的局限性,因此也出现了与激光雷达、超声波雷达等3D传感器的融合。通过多维度的采集硬件设备,帮助更多维度数据融合加速场景的落地;
第三,训练数据的作业精细化。从算法的学术研究到产业落地,数据标注的准确性影响着算法模型训练的表现,且数据的准确性权重正逐渐上升,相应的对于标注内容精细程度的要求也在不断提升。
针对市场呈现的对定制化、精细化、场景化AI数据的旺盛需求,云测数据正通过丰富行业经验积累、技术产研投入、人员管理体系建设以及自建数据场景实验室及数据标注基地,为计算机视觉的众多落地领域提供着高质量的场景数据集,定制化的数据采集/数据标注服务,以及数据标注&管理平台等相关服务,全方位支持文本、语音、图像、视频等各类型数据的处理。
目前,云测数据深度合作伙伴覆盖了汽车、手机、工业、家居、金融、安防、教育、新零售、地产、生态系统等行业。其中包含众多世界500强企业、高校科研机构、政府机构,头部AI企业和大型互联网企业,涵盖了计算机视觉、语音识别、自然语言处理、知识图谱等AI主流技术领域。
声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。