对收集到测井数据进行去除异常值、插值、标准化、独热编码等数据预处理,分别得到预测储层物性的回归数据及识别储层含油气性的分类数据。 为了预测储层物性孔隙度,本文构建了SVM支持向量机回归模型,并对该网络的BoxConstraint和KernelScale等关键指标进行超参数调整。基于上述模型,采用留一法交叉验证将单个井作为测试集,其余不包含该井的测井数据作为训练集,以此来分析单个井的孔隙度预测结果。 对影响因素数据(除去取值深度)进行主成分分析(PCA),将第一主成分和第二主成分作为SVM支持向量机模型的输入向量序列,以六类流体性质(含油水层、差油层、干层、水层、油层及油水同层)作为标签形成输出向量序列。由于典型的SVM支持向量机只能处理二分类问题,因此本文分别构建了六个SVM分类器。并且利用混淆矩阵、ROC曲线及AUC面积来衡量以上分类模型的性能。 适用方向:统计学及机器学习算法(SVM)的实例应用 关键词:SVM支持向量机;留一法交叉验证;主成分分析;matlab
1
决策树学习是数据挖掘中常用的方法。 大多数商业软件包提供复杂的树分类算法,但它们非常昂贵。 这个 matlab 代码使用“classregtree”函数来实现 GINI 算法来确定每个节点 (CART) 的最佳分割。 这段代码的主要功能名为Tree。 它直接从 excel 或 csv 文件导入数据,使用第一行作为变量名(必要)。 第一列是结果组,它必须是数字。 在 Matlab 工作区中启动分类树类型: Tree('filename.xls') 或 Tree('filename.csv') (注意您的 excel 文件包含第一行变量名称和第一列中的结果组) . 它也可以直接从 matlab 文件(.mat 扩展名)导入。 请使用以下 3 个变量创建一个文件:X(协变量值矩阵)、y(结果值)、textdata(单元格结构包含结果和协变量的文本名称)。 如果您需要示例,请输入:[X, y,
2022-08-10 11:45:50 1.54MB matlab
1
为准确模拟黄河流域某矿区地层分布形态,选取80个地质云钻孔数据利用ArcMap分析数据特征,运用克里金方法插值过程中考虑变异函数模型和搜索步长数的影响,通过交叉验证确定最优插值方式,并通过三维可视化对结果进行展示。结果表明:采用普通克里格插值方法,参数选择高斯模型、步长数9插值精度最高。多模型参数比较的结果可应用于类似矿区地层分布的研究。
1
交叉验证优化SVM参数,训练模型
2022-08-03 09:07:34 3KB 交叉验证 svm参数训练 模型训练
1
什么是机器学习分类算法?【K-近邻算法(KNN)、交叉验证、朴素贝叶斯算法、决策树、随机森林】.doc
2022-07-09 19:05:02 1.75MB 技术资料
matlab 10折交叉验证知识代码CSE-5334-数据挖掘 lin_regression_Matlab.txt包含线性回归Matlab代码。 lin_regression_Python.txt包含线性回归Python代码。 在ATNT50目录中,我们有 trainDataXY.txt 它包含45张图像。 来自类别1的图像1-9。来自类别2的图像10-18,以此类推。每个图像都是一列。 第一行是类别标签。 testDataXY.txt 它包含5张图片。 每个图像都是一列。 第一行是类别标签。 您使用训练数据训练分类器。 训练完分类器后,您就可以对testData中的数据进行分类,并将获得的类标签与那里提供的地面标签进行比较。 这两个数据是简单的训练和测试数据。 它们是预热数据,因此您可以看到分类器如何处理此简单数据。 数据集:ATNT-face-image400.txt: 文本文件。 第一行是群集标签。 第二端行:每列是一个特征向量(向量长度= 28x23)。 总计40个班级。 每个班级有10张图片。 总计40 * 10 = 400张图像 数据集:Hand-writing-26-le
2022-06-01 14:09:49 440KB 系统开源
1
基于交叉svm分类的健康状态分类技术研究 基于交叉svm分类的健康状态分类技术研究 采取了交叉验证的方法优化SVM,并且对原始的数据进行健康状态的分类技术研究 得到ROC曲线等。
2022-05-31 09:11:40 224KB svm
MFCC+svm交叉验证的说话人分类
2022-05-30 14:07:39 906KB matlab
fold 旨在为任何学习者生成交叉验证折叠。 它旨在与标准、工具箱和贡献的学习者一起使用。 它可用于随机或非随机、分层或未分层的 CV。 它可以与任意复杂的重复或嵌套CV方案一起使用。 它可用于引导和 CV 方案,包括引导折叠。 最初使用参数运行,带或不带数据集(分层所需),返回 CV 结构。 随后,它可以仅以CV作为参数运行以产生顺序的下一个折叠。 或者,可以指定特定的嵌套折叠序列来控制生成哪个折叠。 它旨在与任何(监督或非监督)学习算法一起使用,包括内置和标准函数、工具箱和贡献的分类器。 返回的 CV 具有指定每个折叠中使用的子集的索引向量。
2022-05-26 15:22:17 8KB matlab
1
交叉验证: 把样本分为训练集评估集和测试集。
2022-05-22 19:24:22 14.02MB 神经网络 PPT matlab
1