你每天看好几次的疫情地图,原来数据是这么来的!
原标题:你每天看好几次的疫情地图,原来数据是这么来的!
丁香园「疫情地图」1 月 20 日上线,截止当前浏览人次已经超过 20 亿,为了让更多用户快速了解最新的疫情信息,我们与人民日报、学习强国、健康中国等多个国家级平台达成公益合作,并免费向 60 多个商业品牌进行了公益授权。
疫情数据的统计远比大部分人想像的要复杂,即便是「今日新增疑似病例」这样看似简单的数据,很多专业人士都会犯错。而疫情数据统计的完整和准确性又至关重要,稍有差错,就有可能产生信息误导,导致大面积的民众恐慌。
同时,疫情每分每秒都在发生变化,大家都迫切地希望能在第一时间获取相关信息。很多用户,对于我们如何收集整理数据,如何处理数据,这些数据指标的来源和意义都有很大的兴趣。我们特邀 丁香医生数据研究院的负责人詹老师,详细介绍一下相关情况, 也希望这部分共享的 内容,可以给予其他做疫情统计的平台一些帮助。
同时,如有任何批评和建议,我们期盼您能够通过在「丁香医生+」公众号中留言,一起帮助我们持续优化这个产品。
总体数据说明
1. 数据来源
(1)来源于国家卫健委、各省市区卫健委、各省市区政府公开数据;
(2)特别说明:香港数据来源「香港特别行政区政府卫生署」,澳门数据来源「澳门特别行政区政府」,台湾数据来源于「中央流行疫情指挥中心」 ,海外数据来源于各海外官方网站。
2. 实时数据统计原则
(1)每日上午优先将全国数据与国家卫健委公布数据对齐(此时各省市数据尚未及时更新,会出现全国数据大于各省份合计数的情况);
(2)当各省公布数据总和大于国家公布数据时,则全国数据切换为各省合计数;
(3)「较昨日+」的数据,是使用当前国家总数减去国家卫健委公布的前一日的数据,这个数值会根据实时数据发生变化;
(4)疑似数据的「较昨日+」,因为会有转确诊与排除疑似两种情况,因此这个数据我们只采用国家每日公布的新增疑似数据,而不是两日的差异。
3. 疫情趋势图
全国数据使用国家卫健委公布的截至前一日 24:00 的数据,湖北数据使用湖北省卫健委公布的截至前一日 24:00 的数据。每日仅更新一次。
4. 疑似病例数据
因部分省份未发布相关疑似病例数据,目前仅同步全国总数,暂不呈现分省疑似病例。
5. 治愈病例数据
来源于各个省市区县政府官方微博和官方媒体,每日会有多次更新,更新速度快于其他数据。
6. 页面显示的截止时间
为标准北京时间,如您所在时区不是东八区,会自动转为当地时间显示。
7. 丁香园|丁香医生团队全力以赴提供权威、准确、及时的疫情数据,如有任何疑问,欢迎通过微信搜索「丁香医生 +」留言反馈。
图片来源:丁香园|丁香医生 疫情地图
具体指标说明
1. 现存确诊:被确诊为新冠肺炎,且依旧在进行治疗或医学隔离观察的患者数量,(不包含治愈、死亡), 从 2 月 13 日新纳入临床诊断病例(不包含治愈、死亡);
2. 现存疑似:当前仍被判定为疑似的新冠肺炎患者数量;
3. 治愈:所有已经治愈出院的新冠肺炎患者数量;
4. 累计确诊:所有被确诊为新冠肺炎的患者数量(包含现存确诊、治愈、死亡), 从 2 月 13 日新纳入临床诊断病例;
5. 现存重症:当前仍被判定为重症的新冠肺炎患者数量;
6. 死亡:所有已经死亡的新冠肺炎患者数量;
7. 现存确诊「较昨日」:最新现存确诊-昨日官方公布的现存确诊,实时更新;
8. 现存疑似「较昨日」:国家卫健委今日新公布的「新增疑似」,每日仅更新一次,仅统计全国;
9. 治愈「较昨日」:最新治愈-昨日国家公布的治愈,实时更新;
10. 累计确诊「较昨日」:最新累计确诊-昨日官方公布的累计确诊,实时更新;
11. 现存重症「较昨日」:国家卫健委今日新公布的「新增重症」,每日仅更新一次,仅统计全国;
12. 死亡「较昨日」:最新死亡-昨日国家公布的死亡,实时更新;
13. 临床诊断:湖北地区特有分类,疑似患者符合影像学特征定义为临床诊断病例。这部分病例从 2 月 13 日开始被归入确诊病例中。
其他更多问题
问 1:你们的疑似数据和下面两天的疑似数据相减不一样?(你们的疑似怎么新增这么多?)
答:新增疑似病例 ≠ 今日疑似病例 - 昨日疑似病例。因为疑似病例最终会变成三类:确诊病例,保持疑似,排除疑似。因此实际每天增加的疑似病例比今明两天的差值要更高。
正确计算:今日疑似病例=昨日疑似病例 + 新增疑似 - 疑似转确诊 - 排除疑似
(图片说明,国家会单独将「新增疑似病例」进行公布)
问 2:为什么用国家公布的新增,而不是用今日疑似 - 昨日疑似
答:疑似的增长代表的是:新增的疑似是新发现存在风险的人群,因此这个新增的人数控制住了,才能保证确诊人数的进一步控制。
今日疑似病例=昨日疑似病例 + 真实新增疑似 - 疑似转确诊 - 排除疑似
举个例子:2 月 2 日 公布累计疑似为 21558 例,新增疑似 5173 例,这意味着今天我们新发现了 5173 个疑似患者,这 5173 人患者有可能会在后期一段时间内变为确诊病例,这个人群数量的变化是需要密切关注的。
从流行病学的专业上来看,我们用「新增疑似」与「累计疑似」这两个数值就可以很好地看到「疑似」这个数据在疫情上的变化。
问 3:为什么你们的数据和其他平台的不一样?
答:每个平台的统计时间、计算方式、信源都会存在一些差异。我们所采用的数据来源均是官方信源,不采用普通爆料信息。同时信息获取全部都是机器+人工双重审核(会有专业人员进行多道审核),保证数据的准确性。所以最终的数据可能会以准确为先,时间有可能略有滞后。
问 4:为什么下面省份城市的数据加起来和国家总数据不一样?
答:每天上午 8:00~10:00 时国家会公布一次截至前天晚上 24:00 的数据。我们会优先更新全国总数据;各省份数据在国家数据公布后会陆续公布;根据统计原则会出现一段时间省份汇总数据与全国数据不一致的情况。
问 5:为什么省份总的里面有治愈和死亡,但是分到区县怎么没有了?
答:部分省份在公布治愈或者死亡数据时没有公布相关人员所在地域,此时省份合计中会有数据,但在具体城市中会没有相关数据,这样的差异我们会呈现在备注中。
问 6:页面上「较昨日+」是怎么计算的?
答:我们使用国家公布的截止前一日 24:00 的数据作为「昨日标准值」。
我们计算的结果=平台实时数据 - 昨日标准值。
问 7:为什么你们的数据比官方公布的数据高?
答:各卫健委官网每天公布一次数据,我们会实时跟踪数据变化,给到最新的信息。
以上数据说明更新时间:2 月 13 日 16:18。
如官方统计口径发生变化,丁香园会从专业的角度对数据说明进行调整与补充说明。
丁香园|丁香医生团队全力以赴提供权威、准确、及时的疫情数据,如有任何疑问,欢迎通过微信搜索「丁香医生+」留言反馈。
最后,我们希望对那些默默支持着「疫情地图」的志愿者朋友们致谢。
在这段非常时期,众多全国各地的医生志愿者们主动与我们取得联系,希望能够出一分力。他们白天在一线辛苦地工作,晚上还经常和我们的「疫情地图」工作组一起奋战到凌晨,帮助我们一起收集、核查数据。
我们始终相信,只有充分公开的信息,才能最大程度驱散大众心中的不安,才能更好地为一线人员提供参考,抗击疫情。而你们的参与助力,让这一切成为可能,让我们得以不断改进、完善「疫情地图」。
在此,丁香园|丁香医生团队真心感谢所有志愿者的辛勤工作!让我们继续携手前行,共盼春来。
题图来源:图虫创意
如果你是【身在疫情一线的医务工作者】,请与我们联系!
↓↓↓ 点击「阅读原文」进入疫情地图返回搜狐,查看更多
责任编辑: