流行性感冒是一种传染性疾病,传播Swift而广泛。 流感的爆发给社会带来了巨大的损失。 本文设置了流感关键词的四个主要类别,即“预防阶段”,“症状阶段”,“治疗阶段”和“常用短语”。 使用Python网络爬虫从国家流感中心的流感监测每周报告和百度索引中获取相关的流感数据。 通过机器学习建立支持向量回归(SVR),最小绝对收缩和选择算子(LASSO),卷积神经网络(CNN)预测模型,并考虑了流感的季节性特征,还建立了时间序列模型(ARMA) )。 结果表明,基于网络搜索数据预测流感是可行的。 机器学习在基于Web搜索数据的流感预测中显示出一定的预测效果。 今后它将在流感预测中具有一定的参考价值。 ARMA(3,0)模型可预测更好的结果并具有更大的概括性。 最后,给出了本文的研究不足和今后的研究方向。
1