首页 > 华人 > 正文
全球最可靠疫情图日点击超10亿 由两名中国留美博士生操盘
——
2020-04-09 03:12 来源:侨报网综合 编辑:羽尧

侨报网讯】随着新冠肺炎疫情在全球蔓延,约翰·霍普金斯大学监测的疫情数据和相关地图,被多国主流媒体和卫生机构在发布疫情数据时引用,网站平均日访问量达10亿。这张地图背后,是该校中国博士生杜鸿儒、董恩盛和他们的导师。

Coronavirus COVID-19 (2019-nCoV)_20200409174129

约翰斯·霍普金斯大学监测的疫情数据和相关地图。(图片来源:相关页面截图)

“无心插柳”的网红数据项目 一开始纯手动更新

北京《中国新闻周刊》报道,一张黑底、红点,左右两侧列着各国确诊、死亡和恢复病例的地图,成为近来一些国际新闻的背景图片。副总统彭斯去卫生部视察时,卫生部就用这张地图监测全国病例,意大利总理、德国内阁开会时,身后电子屏幕也正在依靠这张地图展示疫情实时情况。

这个数据地图由约翰·霍普金斯大学系统科学与工程中心(CSSE)一年级博士生董恩盛等人发起并维护。最初,他只是想要通过追踪数据来观察一场疫情从生到死的整个过程,用这些数据作为他研究疾病的工具,如今,这个每日点击量超过10亿的网站,已经成为多国政府高层、公共卫生学者和主流媒体引用最多的疫情数据来源,更新和运营这个网站成了董恩盛的“主业”。

1月21日寒假过后,在一次博士生组会上,董恩盛的导师、系统科学与工程中心副教授劳伦·加德纳(Lauren Gardner)和大家聊起新学期的计划,听说中国的新冠肺炎很严重,便问董要不要做个数据仪表板?

董恩盛的研究方向是疾病模型,也就是用数学模型和计算机代码来解释一些流行病学、公共健康方面的问题,对全球流行病的发展趋势做基本的判断和推测。当时他已经在搜集数据准备做这个事情了,两人一拍即合,七八个小时后,第一版疫情可视化地图就做好了,1月22日,这个网站便正式面世了。

去年5、6月份的时候,董恩盛与劳伦·加德纳便在另一个流行病风险性分析项目中做了一个类似的数据可视化地图,当时引来一些美国主流媒体的报道。所以,他说技术思路上是比较成熟的,很快就能调试上线;另一方面,由于他的中文优势,去中国国家卫健委上面抓取数据即可,所以早期团队在中国疫情上比全球其他一些数据来源更及时。

起初几天,数据都靠他手动整理,每天最多能保持4~5次更新。2月1日之后,这种方式变得不可持续,于是项目转为半自动化更新:中国的疫情数据来自丁香园的自动更新,而其他国家的数据依然需要人工审核。为了发现各国新增病例,他们的监测渠道包括世界卫生组织(WHO)、推特、新闻报道、地方卫生部门提供的数据等等。这一阶段,另一个博士生杜鸿儒也加入到数据收集和图表的制作中来。

杜鸿儒和董恩盛。(图片来源:央视新闻客户端)

杜鸿儒(右)和董恩盛。(图片来源:央视新闻客户端)

到了3月初,这个数据小组将美国疫情信息具体到县一级层面。董恩盛告诉《中国新闻周刊》,小组招募了一些志愿者,然后24小时不间断地发布最新数据。

中新社报道,在研发团队努力下,数据已逐渐实现每20分钟即可自动更新一次,并辅以人工审核,在确保准确的基础上提高数据时效性。

杜鸿儒介绍,他们编写了一个程序,从各个数据源收集数据,再整理成统一格式,更新到服务器中。“更新程序的同时,我们也在程序中留有一块人工处理的部分。”杜鸿儒说,任何一个地方,如果累计死亡案例或者累计确诊案例出现下降,这都是异常,他们就要人为检查,确保数据准确。

谁在使用这个仪表板?地方政府、州、联邦政府、公共卫生机构……

《中国新闻周刊》报道,2月19日,董恩盛、杜鸿儒与劳伦·加德纳发表在《柳叶刀》杂志上的文章介绍了这项工作。文章对比了约翰·霍普金斯大学系统科学与工程中心、WHO和中国疾控中心的数据报告。结果发现,他们的病例数据与后二者报告一致,而且他们在捕获新国家或地区中首次报告的COVID-19(新冠病毒)病例上更加及时。

在线科技出版物Digital Trends3月28日发表文章《最可靠的新冠疫情仪表板》,其中提到6种可视化疫情数据通报平台,约翰·霍普金斯的这套系统获得最高评价。原因是该平台“可视化设计最好,导航明晰、阅读方便,且是6个平台中更新最频繁的。”

在3月6日于华盛顿国会山举行的一场简介会上,劳伦·加德纳介绍,这个仪表板受到关注有一段时间了,现在平均每天点击量为10亿,最高峰一天点击达20亿。其间有过几次高峰,例如,当意大利疫情暴发时,许多意大利民众涌入网站,意大利用户数超过了美国。

“谁在使用这个仪表板?据我所知,几乎每个人都在使用。它几乎在所有的社交媒体渠道上走红,一直火到美国地方政府、州、联邦政府、公共卫生机构。”劳伦·加德纳说。

“中国的数据收集整理做得很好”

中新社报道,杜鸿儒表示,网站能快速制作出来,需要感谢中国及早、规范的数据。“在这次疫情发展中,中国的数据收集整理做得很好。”

杜鸿儒认为,国际间的合作很重要,应该把数据变得更加公开、透明、准确,更方便于各科研机构的收集和整理,这样才能对控制疫情发展作出更重要的贡献。

复旦大学公共卫生学院原院长、中华预防医学会新冠肺炎防控专家组成员姜庆五告诉《中国新闻周刊》,在疫情中,任何数据都要公开、透明,保证真实性,否则流行病学家、数学家无法做出判断,也就不能为决策提供可靠的指导。

《中国新闻周刊》报道,霍普金斯团队较高质量的数据成为诸多研究团队进行学术研究的基础,是科学界了解新冠疫情的重要信息来源。董恩盛说,每天他们都会在固定时间发布准确的数据,全世界的学者都可以看到,这方便学者们进行基于时间序列的疫情分析,“而时间序列分析在流行病学,尤其是对于疾病的预测方面有非常关键的作用”。

现在,该数据地图的自动化程度越来越高了,而且学校也给予了很多技术和人力支持。接下来董恩盛希望配合他的导师,利用这些数据研究一下哪些地方比较容易受到新冠病毒的攻击、疫情什么时候会出现拐点等等。

疫情数据有真伪?他们这么看

北京日报客户端报道,对近来国际上围绕中国疫情数据产生的“质疑”,董恩盛也有自己的见解。在他看来,中国疫情数据的增长曲线在达到一定水平后就很和缓,可以证明疫情得到了控制。想要进一步证明数据的真伪,很多国家都很难做到这一点,特别是在疫情蔓延全球之后。

2月13日,湖北突然通报新增了1.3万多例临床诊断病例。董恩盛觉得这是一个比较合理的统计方式的变化,但国际上却因此对中国疫情数据有很多批评。

“其实美国也有类似问题,还有像意大利有段时间只报重症病例。美国有的州县不报外地的病例,比如缅因州挨着波士顿和纽约,如果有一个在大城市注册了身份的感染者回到当地被确诊,可能不会被纳入当地确诊病例进行通报。但他本来所在的大城市也可能不把他列入确诊当中,因为他已经离开了。这就给数据的精确统计造成干扰。”

两人透露,接下来,地图的功能还要做进一步的优化和升级,他们可能将加入美国各州的病毒检测数据,以及确诊病例在人口中的比例,“都是很关键的数据”。(完)

编辑:羽尧
侨报网新闻,未经授权不得转载

美国头条APP下载

苹果版 安卓版

侨报网公众号

微博 微信

格律视频

微博 微信

西雅图在线

微博 微信

湾区在线

微信

旧金山在线

微博

美东侨报

微博

瞧纽约

微信

美国在线

微信

美国中文电台

微信
搜索

登   录

请输入邮箱地址

请输入密码

记住我 忘记密码?

帐号或密码错误

登  录
还没有帐号?注册

注   册

换一张

请输入图片中的字符

获取邀请码 重新发送邀请码

请输入邮箱地址

请输入邀请码

提  交
已有帐号,马上登录

注   册

请输入用户名

请输入4-20个字符

请输入密码

请输入4-12个数字或字母

请输入密码

请输入4-12个数字或字母

注  册
已有帐号,马上登录

忘记密码

换一张

请输入图片中的字符

获取验证码

请输入邮箱地址

请输入验证码

提  交
已有帐号,马上登录

忘记密码

请输入新密码

请输入6-12个数字或字母
提  交
已有帐号,马上登录