基于监测数据及机器学习算法的湖泊水质实时评价技术对当前湖泊水资源的管理、维护和保护具有重要意义。本文针对巢湖水质的类别评价,利用随机森林(Random Forest, RF)分类算法对该区域水质进行类别判定。与其他算法相比,随机森林算法有着精度高、可容忍噪声强等诸多优点。测试结果表明,当决策树的棵数ntree=300,分裂属性集中属性个数mtry=2时,在合肥湖滨监测断面水质分类准确率可达96.15%,在巢湖裕溪口监测断面水质分类准确率高达100%,该方法具有稳健性较高、实用性强、泛化性能好等特点, 能够有效进行水质评价。

1