来自 行业研究 2020-04-30 01:39 的文章

穿越AI发展瓶颈期,清华博士八年终打造国内一流计算机视觉实验室

近日,腾讯优图实验室总监黄飞跃接受CSDN专访,揭秘了腾讯优图八年间的研发和落地历程,以及对计算机视觉的未来展望。以下为专访内容:

12年前,清华大学博士毕业的黄飞跃加入腾讯刚成立不到一年的腾讯研究院,带着5个人的小组,第一个项目是做一款名为“QQ影像”的桌面处理软件,但由于团队都属于IT直男,对于产品一窍不通,于是项目以并不尽如人意的结局告终。

12年后,当初的5人团队已经扩大到数百人的规模,成为计算机视觉领域鼎鼎有名的优图实验室。但细算起来,优图正式成立的时间其实在2012年,这一年,黄飞跃带领的这支团队更名为“优图”,他作为优图团队的负责人,带领这帮人成为国内计算机视觉大规模应用早的一批从业者。

如今,做计算机视觉的人不会不认识优图这个名字,尤其是人脸识别技术和产品,优图的名声更是响亮。作为腾讯消费互联网业务背后的“隐形AI战队”,优图实验室与腾讯AILab和微信AI团队一起,并列腾讯AI三大人工智能团队,为包括QQ、微信、腾讯微视等消费互联网产品提供技术支持。

优图在做什么?

2018年,腾讯宣布战略转型升级,拥抱产业互联网,优图从腾讯内部的一个技术团队开始走向前台,通过腾讯云等对外输出视觉AI能力。

黄飞跃对于优图的定位,就是一个计算机视觉相关技术的研发和落地的实验室,从开始的图像压缩,到后面的人脸识别,再往后的人体识别、OCR等一系列技术,优图从初的围绕腾讯公司内部的需求提供技术支撑,到现在依托腾讯云等产品对外输出产品和解决方案。

有人会好奇,优图到底都做了些什么。实际上,从腾讯内部到ToC,优图的AI技术早已渗透到我们的日常生活中,留心观察的话会发现,我们平常用到的微信刷脸支付、人脸识别对比、随申码、健康码、微众银行等App的人脸核身等,背后都是优图在做技术支撑。比如在微信小程序申请民政服务,检测人脸时出现的蓝色、绿色等不同颜色的光谱,其实就是在做活体检测,确认是否是本人操作。

黄飞跃表示,近一两年,短视频、泛娱乐场景的视觉AI需求比较旺盛,为此优图打造了一系列泛娱乐方面的解决方案,包括美颜美妆、人像分割、趣味合成和生成、人脸融合和变装等,你平常打开的美颜软件,说不定就有优图的存在。

让笔者印象比较深刻的,还有在寻找走失儿童场景中,优图可以实现跨年龄人脸识别,一两岁时丢失的婴儿,丢失十几年之后的儿童也能被精准识别,这样的“黑科技”也是优图研发的。


穿越AI发展瓶颈期,清华博士八年终打造国内一流计算机视觉实验室

了解计算机视觉技术的人应该知道,跨年龄人脸识别对于数据量和模型训练来说都是巨大的挑战,为了充分的从数据中学习人脸自然的跨年龄变化规律,腾讯优图提出了基于DDL(分布式蒸馏学习法则)学习策略的正则化迁移学习策略。基于该策略,算法模型可充分进行跨年龄人脸识别学习,从而让困难的跨年龄识别更加可靠和精准。用这项技术,腾讯成功帮助警方找回多名被拐超过十年的儿童。

“救人一命胜造七级浮屠”,可以造福、方便人类的事情,正是所有技术人的追求,因为这让我们所做的事情变得有了意义。

优图的技术“家底”有多厚?

各种场景下的应用,当然离不开底层技术的支撑。从团队成立之初做图片压缩,到后来转到人脸检测和识别,优图不断洞察新技术趋势,积淀下清晰的技术发展路线。

黄飞跃在清华大学读研读博时,所学专业除了人脸识别和人脸检测之外,还包括人头3D重建、人体动作识别等技术。黄飞跃回忆,那时候人脸识别与现在相比有着巨大的差异,十几年前,火爆的专业是网络工程等方向,计算机视觉方向在当时是冷门。

黄飞跃也承认,当时学术的不成熟导致整个计算机视觉产业链不完整。现在,我们已经可以通过深度学习技术,为很多计算机视觉问题找到很好的解决方案,比如人脸检测识别,我们能够从几百人的合照中找到99%甚至全部的人脸,有遮挡也可以做到,但在当时,深度学习还没有起来,大家更多的是做偏研究的事情,和实际业务结合较少,采集数据难度大,算法在实际应用中效果差,只能在特定场景和小范围内做有限的应用。

总之,当时的计算机视觉研究环境很恶劣,人工智能仍处于发展瓶颈期,体系建设没有展开。2008年,黄飞跃毕业时也曾纠结过去做老师还是进公司,看了很多方向,选择了加入刚成立不到一年的腾讯研究院,起初是跟着leader,后来才带领着5人小组,在迷茫中开始视觉AI的探索之路。

因图像压缩技术声名大噪