来自 科技 2020-04-12 22:27 的文章
美国确诊超50万,约翰·霍普金斯大学疫情地图成
全球感染新冠肺炎的人数突破170万。紧要关头,各国的疫情数据成为大家关注的焦点。约翰霍普金斯大学的疫情地图更是频频出现在媒体报道的中心位置。
小到个人、大到组织,做疫情数据的有很多,连世界卫生组织都建了一个“全球地图”来统计全球疫情数据。但是其中最早的、最受关注是哪个你可知道?
它就是来自约翰·霍普金斯大学的疫情地图,累计访问150亿次(相当于全世界每个人都打开了两次),日均访问超10亿次,是当之无愧的N0.1。
https://coronavirus.jhu.edu/map.html
该地图已经成为新冠肺炎数据最权威的来源。世界各地的新闻机构和政府机构都在使用它,甚至连美国卫生与公共服务部新冠病毒作战室的一张照片中都有它的身影。而这个疫情地图的背后,是两位中国博士生和他们的导师Lauren Gardner。
单日访问量超20亿次,霍普金斯大学疫情地图背后的两位中国博士生
这个COVID-19全球病例跟踪系统的黑色世界地图上布满了红色圆圈,并有全球以及各国、各州的确诊病例、死亡人数和康复人数的统计数字等。
地图不仅是实时的,还是是可交互的,点击不同的国家或区域,就会出现该地的疫情数据,用户还可以根据自己的喜好更换底图。
这个项目的发起者是约翰·霍普金斯大学系统科学与工程中心一年级博士生董恩盛。
近日,董恩盛在网络直播中介绍了这一项目。他谈到,产生做这个项目的想法是在1月20日。
那天是马丁路德金日,美国放假,董恩盛在家里刷新闻,觉得“疫情蛮严重的”,因为之前有相关的研究经验,他想到了去收集数据,以“记录新冠肺炎从发生到人类战胜它的过程”。
1月21日,董恩盛同导师Lauren Gardner见面,二人商量后决定收集数据,然后去做进一步研究。就这样,董恩盛当天花了六七个小时把当日的数据整理出来,第二天,这个疫情可视化地图就与大家见面了。
紧接着,Gardner的另一位博士生杜鸿儒也加入了这个项目。
起初,地图数据完全靠手动进行,每天早晚分别公布一次。但随着疫情的发展,手动更新已然不可能。从2月1日,数据采集系统升级为半自动更新。
董恩盛表示:“抓取的主要数据来源是中国医学自媒体丁香园,而丁香园的数据来源于国家卫健委和各省市区的卫健部门。紧盯丁香园,就能确保‘仪表盘’在中国大陆数据更新的及时性,每15分钟更新一次。”
而对于中国大陆以外的数据,丁香园的更新相对不够及时,于是董恩盛等人找到了其他数据来源,包括官方机构、新闻等,并进行自动监控和手动更新。
自上线以来,该网站的全球日访问量从2亿次上升到了三月初的12亿次,甚至一度达到20亿次。来自世界各地的网民不断涌入,导致服务器一度宕机,为此更换了三台服务器。
对于董恩盛来说,做这个项目也有私人因素。因为他来自山西,随着病毒在中国的蔓延,他希望找到一种方法来帮助他的家人和他的家乡。
“我真的很担心我的家人,当我收集数据的时候,我可以看到这些红点在不断增长,并且从我的家乡蔓延到我所在巴尔的摩,”他说。
https://github.com/CSSEGISandData/COVID-19
“我从来没想过会做这么大范围的项目,而且是实时的。”对于这个疫情地图的走红,董恩盛也觉得不可思议。此外,这个项目在Github上也备受欢迎,目前已收获近两万颗星。
访问量太大导致亚马逊云计算服务器不堪重负,全球最受关注的疫情地图是如何炼成的?
上周五,《科学内幕》采访了董恩盛的导师——霍普金斯大学系统科学与工程中心的联合主任Lauren Gardner,她先前的工作涉及对麻疹和寨卡病毒的流行进行空间建模。下面我们和大家分享采访重点。
作者:采集侠