摘 要 短时强降水是气象上的常见灾害性天气,准确认识短时强降水的发生规律和科学有效地预报是防灾减灾的关键问题。利用江苏省13个气象观测站历史上短时强降水观测资料,用遗传算法进行特征选择,选定影响短时强降水的对流抑制能、对流有效势能、高空水汽通量场等19个特征为主要因素,将是否短时强降水抽象成二元分类问题。借助机器学习中CART决策树算法进行分类分析,构建便于预报员使用的短时强降水预报规则集。实验部分,随机选择3000条样本进行训练模型,得到适合江苏地区的短时强降水规则集,用剩余的838条数据进行检验,模型的短时强降水预报准确率为88.26%,非强降雨预报准确率为96.81%,较特征选择之前分别提升4.75%和0.70%。
1
针对模式识别时原始特征数量大而有冗余的现象,提出了一种基于遗传退火算法的特征选优方法,首先对遗传算法和模拟退火做了简要评论,然后在遗传算法中引入模拟退火的 Boltzmann 更新机制,以克服传统的遗传算法易于过早收敛和易于陷入局部极小的问题,最后阐述、设计了适应度函数和遗传算子。仿真实验表明,该方法在求解的效率和解的质量方面都达到了令人满意的效果。
1
提出了一种基于遗传算法的大数据特征选择算法。该算法首先对各维度的特征进行评估,根据每个特征在同类最近邻和异类最近邻上的差异度调整其权重,基于特征权重引导遗传算法的搜索,以提升算法的搜索能力和获取特征的准确性;然后结合特征权重计算特征的适应度,以适应度作为评价指标,启动遗传算法获取最优的特征子集,并最终实现高效准确的大数据特征选择。通过实验分析发现,该算法能够有效减小分类特征数,并提升特征分类准确率。
2021-10-14 17:35:11 1.01MB 大数据 特征选择 遗传算法
1