内容概要: 1、对收集到测井数据进行去除异常值、插值、标准化、独热编码等数据预处理,分别得到预测储层物性的回归数据及识别储层含油气性的分类数据。 2、为了预测储层物性孔隙度,分别构建了BP神经网络和长短期记忆神经网络,并对该网络的隐含层数、学习率衰退因子和RMSE等关键指标进行对比分析及网络拟合度检测。此外,采用留一法交叉验证将单个井作为测试集,其余不包含该井的测井数据作为训练集,以此来分析单个井的孔隙度预测结果。 3、为了识别储层含油气性,分别构建了BP神经网络和循环神经网络(LSTM及Bi-LSTM),并利用混淆矩阵、ROC曲线及AUC面积来衡量以上分类模型的性能。 适用方向:统计学和神经网络方向案例分析 其他说明:附件包含预处理后的数据、BP和LSTM回归模型代码、BP和LSTM和Bi-LSTM分类模型代码,以及所有的分析结果图,并附上完整报告。 测井数据;BP神经网络;循环神经网络;留一法交叉验证;Matlab
1
对收集到测井数据进行去除异常值、插值、标准化、独热编码等数据预处理,分别得到预测储层物性的回归数据及识别储层含油气性的分类数据。 为了预测储层物性孔隙度,本文构建了SVM支持向量机回归模型,并对该网络的BoxConstraint和KernelScale等关键指标进行超参数调整。基于上述模型,采用留一法交叉验证将单个井作为测试集,其余不包含该井的测井数据作为训练集,以此来分析单个井的孔隙度预测结果。 对影响因素数据(除去取值深度)进行主成分分析(PCA),将第一主成分和第二主成分作为SVM支持向量机模型的输入向量序列,以六类流体性质(含油水层、差油层、干层、水层、油层及油水同层)作为标签形成输出向量序列。由于典型的SVM支持向量机只能处理二分类问题,因此本文分别构建了六个SVM分类器。并且利用混淆矩阵、ROC曲线及AUC面积来衡量以上分类模型的性能。 适用方向:统计学及机器学习算法(SVM)的实例应用 关键词:SVM支持向量机;留一法交叉验证;主成分分析;matlab
1
贝叶斯模型matlab代码帕累托平滑重要性抽样 (PSIS) 和 PSIS 留一法交叉验证参考代码 介绍 这些文件为 Matlab/Octave 和 Python(由 制作的 Python 端口)实现了帕累托平滑重要性采样 (PSIS) 和 PSIS 留一法交叉验证。 loo 包中对应的 R 代码 相应的 R 代码可以在 中找到,也可以从 中获得。 ArviZ 中的 Python 代码 PyPI 中可用的 loo 和 psislw 函数具有相应的功能(请参阅 参考资料)。 内容 'm' 文件夹中的 Matlab/Octave 代码 'psislw.m' - 对数重要性权重的帕累托平滑 'psisloo.m' - 帕累托平滑重要性采样留一法对数预测密度 'gpdfitnew.m' - 估计广义帕累托分布的参数 'sumlogs.m' - 向量的总和,其中数字用对数表示 'py' 文件夹中的 Python 模块 'psis.py' - 在 Python (Numpy) 模块中包含以下函数 psislw - 对数重要性权重的帕累托平滑 psisloo - 帕累托平滑重要性采样留一法对数预测密
2022-04-02 16:37:33 53KB 系统开源
1
matlab交叉验证代码厕所 拟合贝叶斯模型的有效近似留一法交叉验证 loo是一个R包,它使用户可以为拟合的贝叶斯模型计算有效的近似留一法式交叉验证,以及可以用于平均预测分布的模型权重。 loo软件包打包为来自以下对象的近似LOO-CV和WAIC实现了快速稳定的计算 Vehtari,A.,Gelman,A.和Gabry,J.(2017年)。 使用留一法交叉验证和WAIC的实用贝叶斯模型评估。 统计与计算。 27(5),1413--1432。 doi:10.1007 / s11222-016-9696-4。 ,。 并按照以下说明计算模型权重 Yao,Y.,Vehtari,A.,Simpson,D.和Gelman,A.(2018)。 使用叠加来平均贝叶斯预测分布。 在贝叶斯分析中,doi:10.1214 / 17-BA1091。 ,。 从现有的后验模拟绘图中,我们使用帕累托平滑重要性抽样(PSIS)(一种用于调整重要性权重的新过程)来计算近似LOO-CV。 作为我们计算的副产品,我们还获得了近似标准误差,用于估计的预测误差和比较两个模型之间的预测误差。 我们建议使用PSIS-LOO-CV而
2021-10-14 15:40:51 1.72MB 系统开源
1
[PearsonR, PearsonP, SpearmanR, SpearmanP, yhat, R2 ] = BenStuff_CrossValCorr( x,y, [MathMagic], [OmNullModel] ) 留一法交叉验证的简单线性回归输入变量: x, y:数据向量(x(n) 和 y(n) 对应一对观测值) MathMagic:可选参数; 默认为 1 - 避免使用 MathMagic 的强大功能循环遍历 n 模型( http://stats.stackexchange.com/questions/164223/proof-of-loocv-formula ) OmNullModel:可选参数; 默认为 1 - R2 的空模型应该是“全知的”吗? 如果设置为 1(默认),R2 将比较解释方差与围绕 *all* 数据点均值的方差; 如果设置为 0 将与迭代特定的平均值进行比
2021-09-28 21:49:55 3KB matlab
1