北京798附近一家咖啡馆内,AI数据标注师廖仔谈及店内的咖啡机器人。这家占地近3000平米的咖啡馆中,最引人注目的是依据店主理人建模的人型机械臂咖啡机器人。
99年出生、专科学历的廖仔曾在深圳体制内单位工作,后离职学习建筑设计课程,转而成为大厂外包数据标注师,月薪从3K涨至13K。
相比之下,985硕士毕业的苏打在职业空窗期尝试进入AI行业,但经过一次数据标注兼职后放弃了这一方向。她认为数据标注是“纯烧脑的体力劳动”,缺乏上升空间。
作为人工智能训练师的一个工种,数据标注师2020年被纳入国家职业分类目录。围绕这个职业的讨论呈现两极化:一方面,大模型扩张时期吸引了大量求职者;另一方面,从业者普遍感到不安,担心自己只是优化大模型的“耗材”。
随着大模型开发转向场景落地,标注岗位需求发生变化,更垂直化且专业门槛更高。廖仔和苏打分别代表了转型成功与抽身离开的两种典型。
数据标注可大致分为三层:自动售货机标注依赖“体力+注意力”;为大模型思考过程打分需要较强理解力;大模型评估则涉及流程管理和沟通。
站在产业链上游的Jackson表示,数据标注主要介入微调和强化阶段。虽然这些环节可以使用自动化手段或模型生成数据,但人工标注的数据更具多元性和正确性。
据Jackson估算,一次完整训练需几十万条数据,成本成为大厂选择外包、众包的主要原因。兼职数据标注师时薪仅30-60元,工作强度高但回报低。
数据标注工作缺乏技术壁垒,从业者难以积累“独占优势”。从薪资水平来看,兼职日薪多在120-500元,外包岗位月薪9-17K,正式岗位月薪15-25K,远低于技术岗和算法岗。
苏打最终放弃兼职,原因是职业发展空间有限。Jackson用金字塔形容AI从业者分布:塔底是标注,腰部是应用,再往上是微调和后训练,塔尖是基础模型设计。背景决定职业高度,学历成为硬性门槛。
同时,模型本身可能取代标注师。在一些成熟文本模型中,模型合成数据已替代80%的人工标注。海外企业如苹果、特斯拉也因自动标注能力提升裁撤相关团队。
尽管如此,随着AI技术发展和新场景出现,数据标注需求仍将长期存在。清华大学报告显示,2024年数据标注产业有用工需求的企业增至1195家,2025年中国人工智能基础数据服务市场规模将突破120亿元。
廖仔对职业未来充满信心。他曾经历AI冲击设计行业的过程,主动学习并转型。他每天下班后坚持学习AI内容,并通过社交媒体记录心得。
尽管机器人目前更多是一个装饰品,但人的主动性始终是关键所在。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。