来自 行业研究 2019-08-06 22:50 的文章

高性能计算、数据爆炸到深度学习,从热点话题变换看计算机行业的发展

吴晓波在《激荡三十年中这样描述一个国家里辉煌的三十年:“它承载了太多人的光荣与梦想,它是几乎一代人共同成长的全部记忆,“当这个时代到来的时候,锐不可当。万物肆意生长,尘埃与曙光升腾,江河汇聚成传,无名山丘崛起为峰,天地一时无比开阔。

时代车轮向前,2008 到 2019 又已过去十年,以信息和通信技术为基石、人工智能为使能的第四次技术革命引领着人类社会迈向万物感知、万物互联、万物智能的世界。在我们的个人生活、商业和社会形态等领域掀起前所未有的变革。

其中风起暗涌,让我们跟随 CNCC 年度话题中探寻。

一、不可思议的高计算能力

——1970 年,Intel4004 处理器每秒可以处理 92000 条指令,而相比我们现在的普通手机,每秒处理 10 亿条指令,电脑也越来越强大,能够存储越并处理这些庞大的数据。

1999 年,NVIDA(英伟达)公司首先推出了 GPU,主要用于处理游戏中每秒产生的大量的帧数数据。专家们发现,将 GPU 加入深度学习的架构中,赋予其训练神经网络的能力,可以执行大量任务的并行计算能力,能更迅速的处理各种各样的任务。GPU 让深度学习系统有能力完成几年前计算机不可能完成的工作,比如房屋地址识别、照片分类和语音转录。有 10 亿个连接的 GoogleX 项目,训练人工神经网络的时候使用 1000 台电脑和 16000 个 CPU。然而在同等工作量和时间下,装备了 64 个 GPU 的 16 台电脑就可以运算出结果。

让人工神经网络快速运行是很困难的,因为成千上万的神经元要同时互动。取决于任务种类,有时候使用传统的中央处理器(Central Processing Unit,CPU)运行神经网络需要几周才能出结果。然而用图形处理器(Graphics Processing Unit,GPU), 时间能大大节省,同样的任务只需要几天或者几小时就可以出结果。

代表论坛:

中国计算机事业创建五十周年纪念大会暨 2006 中国计算机大会的“千万亿次计算机”主题,报告人:孙凝晖:中科院计算所研究员;祝明发:联想集团首席科学家;谢向辉:江南计算所研究员;王恩东:浪潮集团高级副总裁向社会揭示了先进的算力器。

在 2011 年中国计算机大会深圳高性能计算论坛:George Cai-Intel Inside HPC - Architecture and Challenges;唐志敏 - 可持续的高性能计算;王恩东 - 高效能计算机架构与应用创新;谢强 - Kepler GPU 体系架构与 E 级超算的挑战再次论道高性能计算发展。

高计算能力发展作为计算机技术的基石,伴随着摩尔定律,其不可思议的发展速度让计算机行业日新月异。

二、爆炸的数据量

——根据 Cisco(思科) 同济,1992 年全球互联网流量是每日 100GB,而到 2015 年的时候,流量已经达到了每秒 20235GB,现在全球九成的数据都是在过去两年生成的。

互联网的爆发让大数据变成了可能,为火热的人工智能模型训练提供了充足的原材料。这些大数据是训练深度人工神经网络里上百万的神经元和权重的前提。用数据构建神经网络的最好例子是上文提及的 Google X 的一个项目。2012 年 6 月,Google 展示了当时最大的神经网络之一,其拥有超过 10 亿个连接,启用了 16000 个 CPU。有斯坦福大学计算机科学教授 Andrew Ng 和 Google 研究员 Jeff Dean 带领的团队给这个系统展示了 1000 万张从 Youtube 视频中选择的图片,这种图片数据量在十年前是想象不到的。

代表论坛:

2013 中国计算机大会以“数据空间,放飞梦想为主题,重点探讨大数据领域的学术、技术以及应用问题,以及移动互联网等业界关心的问题。上海交通大学梅宏等两院院士在大会的主题论坛“大数据上演讲,阐述大数据对计算领域和社会产生的深远影响并探讨业界对大数据的解决之道。

2014 CNCC 主题“信息安全,数据为先,探讨在互联网时代、大数据背景下的信息安全所面临的全新挑战和亟待解决的问题。

数据使用、数据治理再到数据安全,是行业对于数据爆炸本身的再审视。

三.算法不断突破(尤其是深度学习)

——科技企业、风投资本以及各国政府,都在大力支持人工智能,机器学习作为人工智能的主要技术手段,吸收了高达六成的投资份额。

深度学习