新型冠状病毒肺炎发病日期估计及影响因子分析(PDF)
《现代预防医学》[ISSN:1003-8507/CN:51-1365/R]
- 期数:
- 2020年24期
- 页码:
- 4422-4426
- 栏目:
- 流行病与统计方法
- 出版日期:
- 2020-12-30
文章信息/Info
- Title:
- Estimating the onset dates of 2019-nCoV Cases and its impact factors
- 作者:
- 周雨1; 张国平2; 薛逸飞3; 4; 汪如良1; 万冉冉3; 庞华基5
- 1.江西省气象服务中心,江西 南昌 330096 ;
2.中国气象局公共气象服务中心;
3.江西省基础地理信息中心;
4.江西省测绘地理信息工程研究中心;
5.青岛市气象局
- Author(s):
- ZHOU Yu*; ZHANG Guo-ping; XUE Yi-fei; WANG Ru-liang; WAN Ran-ran; PANG Hua-ji
- *Jiangxi Meteorological Service Center, Jiangxi, Nanchang 330096, China
- 关键词:
- 发病日期; 确诊日期; 随机森林; 影响因子
- 分类号:
- R181.2
- DOI:
- -
- 文献标识码:
- A
- 摘要:
- 目的 探讨发病日期影响因子,估计缺失发病日期,完善新型冠状病毒肺炎病例数据库,为开展疫情大数据分析提供参考依据。方法 基于江西省各级卫生健康委员会公开的2020 年1月22日 - 2月25日新增 2019 - nCoV 确诊数据,建立时间序列数据库,分析发病日期与确诊日期的分布特征。采用随机森林算法,研究确诊日期、患者信息(性别、年龄、有无去过武汉等)、患者居住地经纬度、患者居住地与南昌的距离等因子与发病日期的关系。以均方根误差(RMSE)、决定系数(R2)2个指标评价模型估计准确度,并通过计算精度平均下降率给出了各影响因子对发病日期估计的重要性排序。结果 确诊日期在影响发病日期估计方面发挥了决定性作用,距离和经纬度也在是模型估计中的重要因子。70%左右病例发病日期与确诊日期存在2~7天时间差,其中3天为最多数;利用随机森林算法对缺失的发病日期模拟估计,检验结果显示发病日期最优估计值R2为0.98,表明估计值与实际值基本吻合,模型估计效果好。结论 随机森林模型能够比较全面地描述发病日期的影响因子,且直观、便捷,可用于指导完善患者信息和修正传染病传播预测参数。
备注/Memo
- 备注/Memo:
- 基金项目:国家自然科学基金( 41871020);中国气象局公共气象服务中心创新基金项目(M2020032 )
作者简介:周雨(1988 - ),女,硕士,工程师,研究方向:气象、健康大数据分析
通讯作者:汪如良,E - mail:wangruliang7112@163.com
更新日期/Last Update: 2020-12-30