该数据集的挑战在于,数据来自50或60米的气象塔的数据。 每个塔都有多个风速计,一个风向标和一个温度传感器。 每个传感器在10分钟内测量数据并报告10分钟内的平均值,标 准偏差,最小值和最大值。 通常情况下,最高两级有一对风速计(例如60米高的59米和49米),然后是30米和/或10米的单个或配对风速计。 a)训练数据集 提供的数据文件中有两个结构,第一个是“Train_EngineRun”。这包含结构内的260个发动机。在每个结构中,该引擎的生命周期数据,从新引擎直到退役。数据包含24列,每行对应一个给定的航班。每次飞行数据都采集自六种飞行状态中的一种,飞行状态标签也有提供。
1
对于航空发动机寿命预测问题,它的难点在于特征数数多,而且特征也是传感器所收集到的数据,传感器一般带有噪声,会造成拟合过程中的不准确性,设计一个多变量输入,单变量输出的预测模型,而RNN(循环神经网络)是一类以序列数据为输入,在序列演进方向进行递归且所有节点循环单元都按照链式连接的递归神经网络,它非常适合用作发动机寿命的预测模型,一方面,发动机数据具有时间信息,另一方面,单纯的RNN在处理数据时存在梯度消失问题。所以我们在RNN中引入LSTM(长短期记忆单元),这样可以很好解决上述两个问题
1