数据集 hwlp5 data 中包含由非线性函数y=f(x)+n合成的数据,其中n
为加性噪声。请你研究多项式函数能在多大程度上可以用来表示这个关系。
(1)随机选择n=10个数据点作为训练数据,其余数据点用作测试样本。建
立一阶多项式模型(例如,y=ax+b,提示:在 MATLAB 中,使用命令 polyfit)。
以测试样本对测试样本的形式,绘制模型输出。计算模型的均方误差(MSE,模
型预测值与正确输出值之间的平方误差平均值)。
(2)对于 2-10 阶多项式,重复做(1)。
(3)重复做(1)和(2)各 100 次,估计每一阶多项式重复 100 次的平均 MSE。
绘制log(MSE)(即对数尺度的 MSE)与多项式阶数的关系图。
(4)对训练集大小为n={15,20,25,50,100,200},重复做(1)-(3)。
(5) 讨论模型的log(MSE)随多项式阶数和用于训练模型的样本数如何变化。
讨论你的结果。
================================================================================
1