这篇论文主要探讨了中国古代玻璃制品的风化模型,利用随机森林算法进行数据分析和预测。文章在数学建模的背景下,获得了山西省一等奖,论文的核心技术包括随机森林优化、数据填充、特征选择、降维模型和分类算法的应用。
对于问题一,研究者处理了数据中的缺失值,使用众数来填充颜色数据。通过交叉表和卡方检验,确定了表面风化与玻璃类型之间有强相关性,与纹饰有弱相关性,与颜色则无明显关联。通过观察化学成分的分布,如氧化铅和氧化钾含量,发现不同类型的玻璃具有特定的成分特征。然后,他们构建了随机森林模型,以风化前后的均值偏差率预测化学成分含量,并验证了预测的准确性。
针对问题二,论文建立了基于重采样的随机森林模型来识别高钾玻璃和铅钡玻璃的分类规律。通过对14个化学成分的分析,确定了二氧化硅、氧化钾、氧化铅和氧化钡作为关键因素。通过投影寻踪法降低维度至5个重要成分,并利用改进的k-means聚类算法,将样本分为3个亚类,结果与实际相符。通过调整聚类数优化损失函数,验证了初始设定的合理性。
在问题三中,研究者加入了有无风化的指标,继续使用随机森林模型预测玻璃类型,测试集预测准确率达到100%。同时,通过支持向量机(SVM)和贝叶斯判别法结合扰动项,验证了有无风化指标对分类结果的影响,结果显示这个指标的作用不大。此外,通过正态扰动测试随机森林模型的敏感性,证明模型的稳定性。
对于问题四,论文建立逐步回归模型,寻找不同类别化学成分间的线性关联。通过VIF方差膨胀因子分析,确定了两类玻璃在二氧化硅、氧化钾、氧化铅和氧化钡等成分上的显著差异性,这与之前的问题二分析结果一致。
总结来说,这篇论文在数学建模的框架下,利用随机森林算法解决了古代玻璃制品风化的建模问题,包括了数据预处理、分类模型建立、特征重要性分析、降维聚类和线性关联研究等多个方面。这些方法不仅在解决本问题上取得了良好效果,也为类似的历史文物研究提供了有价值的分析工具和思路。
1