来自 趣事 2021-01-25 19:39 的文章

AI环境下,你了解数据标注吗?

  上个10年到20年,电商在不增加社会产品总量的前提,通过技术互联等方式优化了社会产品分配方式,推动了社会进步;而AI的量级在可预知的将来将会大大超过电商的创新影响力,AI将会在未来全面推动各个产业升级和优化。

  数据标注的发展空间也基于此,通过原材料加工的形式参与到了人工智能大行业中。随着人们对于AI的期待值不断地升高,经过标注后的高精度数据将会是不可忽视的资源。数据标注行业,一个因为人工智能崛起而新兴的行业。大多数AI实验室、初创型AI公司在发展初期如果雇佣大量的人力进行数据标注,就不得不面临下面两种处境:首先对公司的管理方面就是巨大的挑战,在研发产品的同时还得把大量精力放在如何管理大量标注人员身上。

  众所周知,使用监督学习方法做分类任务时,往往训练样本规模越大,分类器的性能就越高。但是在面临实际问题时,我们接触到的大量的来自互联网或其他来源(如学术界或商业界)的都是未标注的数据。然而标记样本通常是代价比较大的,比如海量标注需要耗费大量时间和人力(海量的语料和图像标注);又比如一些数据需要领域内的专家来进行人工标注,这样数据标注便成了人工智能算法商用的一个难题。

  “AI是改变,更是未来,它将赋能每一个人点亮生活”,生活点亮之时,并不是数据标注暗淡之日,AI由感知向认知,由“麻木不仁”向“喜怒哀乐”,由“唯唯诺诺”向“杀伐决断”的路还很长,它还不是他/她。