AI奇迹短期难再现 深度学习潜力已近天花板
AI被认定为是人类历史上第四次工业革命,其发展必然会伴随着技术的不断演进、应用的不断祛魅。这其中必然也会出现所谓各种泡沫,各种事后被证实的“笑料”。但不可否认的是,初期的人工智能正为我们的生活陆续带来惊喜。无论是小到点外卖,还是大到疾病防控、金融监管。我们期待着,人工智能技术未来给生活带来的更多温暖和便利。
2018年谷歌I/O大会上,CEO Sundar Pichai展示了一项技术,用Google Assistant在没有人类干涉情况下进行预约服务。
当听到对方回复“让我查询一下时间”时,Google Assistant回复了声“嗯哼”,技惊四座。一般情况下,人们对于这部分的回应可能会认为是“好的”之类,能在当下出现这种极其接近人类的情感化回复,已经是很让人惊讶的表现了。
但事实似乎并非如此。近日美国媒体的报道指出,现实生活中谷歌智能助手绝大部分仍是由谷歌呼叫中心的员工代为处理。为此,谷歌官方回应是,为了保障餐厅在接受订餐时的体验,并未强力去人工化。
一石惊起千层浪。似乎这家全球领先的AI技术公司遭遇了一场信任危机,而关于背后的AI技术发展,也在AlphaGo后并未再有让人惊喜甚至“惊惧”的表现。
近日,清华大学人工智能研究院院长张钹接受媒体采访也指出,AI奇迹短期难再现,深度学习潜力已近天花板。
深度学习的瓶颈
从技术角度来看,近些年人工智能实现飞跃突破的背后,是由一个叫做“深度学习”技术的加速突破带来的。
但其实早在2006年,“深度学习”这一概念便被Geoff Hinton发表论文时正式提出。他也因此被称为“深度学习之父”、“神经网络先驱”,并获得2019年的“图灵奖”。
为什么到了近两年,深度学习才终于在AI世界“有了姓名”,Hinton为什么到今年才为此获奖?这与深度学习本质上存在一定瓶颈有关。
Hinton教授发表论文后的2006年到2012年间,限于整体计算机算力和数据基数问题,深度学习并没有条件发挥它的真实效力。在2012年,Hinton教授和他的两个学生在ImageNet比赛上,使用深度学习技术将识别错误率从26.2%猛然降低到15.3%,这才使深度学习被广为关注起来。
到了2016年,谷歌推出的AlphaGo系统陆续击败人类围棋世界冠军,甚至引发过关于“机器将取代人类”的论调(当然答案是否定的)。这背后都有赖于“深度学习”技术的推动。
以至于到今天,“深度学习”一度成为可以跟“人工智能”并肩的词汇而普世。
“深度学习”技术逐渐成熟的背后,是与深度神经网络层数的演进有关。从20世纪80年代开始,神经网络经历过单层神经网络、多层神经网络和深度神经网络三次发展阶段,演进带来的是,能够容纳的数据量有了巨大扩容。
当然问题也就随之而来,这意味着深度学习的发展,有赖于对有效数据的积累和学习,而有效数据则有赖于人类介入进行大量的数据标注。
在5月25日举行的2019未来论坛·深圳技术峰会上,美团搜索与NLP部负责人王仲远就指出,深度学习其中一个本质,是需要大量的标注数据来寻找事物之间的静态映射关系。
显然目前不太适合深度学习的问题也很多,比如一些创造性活动中,数学家、物理学家的工作就无法被人工智能简单取代;再比如一些无法提供大量标注数据的领域、一些结果需要可解释的领域。这些都成为深度学习技术目前应用的一个瓶颈。
深醒科技创始人、首席科学家袁培江此前也向表示,AI技术的发展在不断迭代。理论上机器学习掌握了所有存储在其中的数据,就可以达到100%准确度。围棋博弈的棋盘变化情况达到10的172次方,但还可以继续优化,这是漫长的过程。
他认为,依靠粗暴的数据驱动会有阈限,当前深度学习的方法很快会遇到天花板。业界正在谋求算法数据可解释性、模型合理性的进一步探索。“准确率从90%到99.99%会发展很快,但到小数点精确到更后面时,技术瓶颈会越来越明显。那么与应用落地结合,尤其和其他数据结合是必然。”
如何突破瓶颈?
深度学习的发展其实远远没有达到能够“惊人”的地步。也因此,伴随着“AI代人”说法而生的,还有“弱人工智能”这个对当下阶段的定义。
这背后涉及的,其实是关于深度学习的“黑盒子”问题。由于人脑的运作存在诸多包括感情、记忆、常识等主观因素共同影响,这并不是现阶段机器可以全部学习到的内容。而学界关于人脑运作机制问题尚未有进一步的进展。