MATLAB模式识别实现指标分类评估预测如环境业绩等-Use_For_Predict.m
最近看到很多会员需要使用MATLAB神经网络做如下的事情:
1:MATLAB神经网络对水的质量的分类、评估、预测 (属于环境类分类、评估预测)
2:MATLAB神经网络对空气质量的分类、评估、预测 (属于环境类分类、评估预测)
2:MATLAB神经网络对土壤质量的分类、评估、预测 (属于环境类分类、评估预测)
3:MATLAB神经网络对学员的个人表现进行分类、评估、预测 (属于个人业绩鉴定)
4:MATLAB神经网络对医学、生物学上的细胞、疾病等分类、评估等(属于医学、生物学)
5:MATLAB神经网络对交通、物流等效率方面的分类、评估、预测等(属于交通、物流管理)
6:MATLAB神经网络用于故障诊断
7:概括来讲,就是使用神经网络对某些指标(如空气质量、水质量、个人业绩等)进行“有限”的分类、预测、评价等。
在这里,我特别强调“有限”两个字,因为这正是模式识别工具箱可以解决的问题。我看到很多会员使用不同的神经网络(如模糊识别,RBF, SVM等)。根据我多年的使用经验,其实基于多层BP网络的模式识别是最容易实现、效果非常满意、且结果非常具有说服力。很多会员没有掌握模式识别的精髓,或者网络训练好以后不知道如何评估、使用等。现在我用一个完整的例子来给大家展示一下它的优点。
不知道什么是模式识别,什么是BP网络的会员,请先看一下这个视频:MATLAB模式识别工具箱视频教学
用MATLAB模式识别工具箱(函数)来对某些指标(如空气质量、水质量、个人业绩等)进行分类、评估、预测,分为三步:
数据准备训练和评估预测
下面我来一步一步讲解,先谈数据的准备:
确保输入数据(包括训练以及将来要预测的数据)在比较接近的范围里(归一化是其中一种方式)。
这一个步骤不仅仅是在模式识别里,其实在任何一种网络里,这一步都是必须的。比如说你有400组数据,每组数据对应一个中国县城的空气质量。假设每组数据含有6个指标(称之为A,B,C,D,E,F,G), 如果数据A的范围是10^5-10^7, F的范围是0.1-0.5, 如果用这些数据来训练,很容易导致网络的权重也有同样的数量级的差别,结果是你的网络会非常的“敏感”(可以想象一下,如果F对应的权重是10^10,那么即使F稍微变化一下,都有可能导致网络的输出结果不同。而有时候这样的敏感度并不是你想要的,你可以对数据进行归一化处理,把数据都转换到0-1的区间内。
MATLAB模式识别工具箱可以自动对输入数据进行归一化处理,所以你只要明白这个过程,但是并不需要你额外写程序来处理这些数据。对输出数据进行二进制量化
通常情况下,用于测试的输入数据所对应的输出数据不是量化数据,比如说:优、良,或者是一级、二级等等。那么通常我们用二进制来表达,两位数字的二进制可以表示3类(01,10,11),三位数字的二进制可以表示7类(001,010,011,100,101,110,111,通常我们不使用000)。二进制的顺序不重要,比如说优可以对应001,也可以用010来表示。
经过简单处理,输入数据和新添加的二进制输入数据如下图所示:
神经网络——输入数据模式识别.png
MATLAB模式识别实现指标分类、评估、预测
原始训练数据下载:
training_data.xls
MATLAB模式识别实现指标分类、评估、预测
把数据导入到MATLAB程序里close all
clear all
clc
x=xlsread;
y=xlsread;
inputs = x';
targets = y';复制代码
我们再谈谈网络的训练和评估:
你可以使用MATLAB自带的模式识别工具箱界面来导入数据、调整参数等,然后得到结果。我通常第一次这样使用,得到一个基础架构以后,然后生成m代码,再在代码上修改。这里我演示给大家,如果通过程序来实现。下面是用来做模式识别的代码(工具箱产生的函数):
% 创建一个模式识别网络(两层BP网络),同时给出中间层神经元的个数,这里使用20
hiddenLayerSize = 20;
net = patternnet;
% 对数据进行预处理,这里使用了归一化函数(一般不用修改)
% For a list of all processing functions type: help nnprocess
net.inputs{1}.processFcns = {'removeconstantrows','mapminmax'};
net.o
2021-05-27 22:34:17
600B
matlab
1