Python 股票数据分析 tushare获取上证指数和各股票的数据 各类指标统计散点图折线图线性回归建模 三因子模型R market SMB HML jupyter notebook numpy pandas statmodels matplotlib 数据分析 数据挖掘 机器学习 人工智能
2023-02-09 17:04:30 3.84MB Python 股票 数据分析
1
偏最小二乘回归(PLSR)统计建模方法本质上是对数据平均趋势的估算,无法避免“依据错误的数据得到错误的模型”的根本问题.为此,提出用数据包络分析(DEA)优化偏最小二乘回归的建模方法,用DEA方法对数据进行评价,剔除无效数据,将有效的数据用来偏最小二乘回归建模.该方法能有效克服干扰数据对提取成分的影响,弥补偏最小二乘方法的不足.通过实例计算并与PLSR、主成分回归(PCR)比较分析表明:DEA优化偏最小二乘回归建模平均绝对误差为2.66%,低于PLSR的4.07%和PCR的4.45%.
2022-09-17 14:51:54 302KB 工程技术 论文
1
这是一个全面的、用户友好的工具箱,实现了贝叶斯线性回归、逻辑回归和计数回归的最新技术。 该工具箱提供了 ridge、lasso、horseshoe、horseshoe+、log-t 和 g-prior 回归的高效且数值稳定的实现。 对于预测变量数量大于样本大小的数据集,建议使用套索、马蹄形、马蹄形+ 和 log-t 先验,并且 log-t 先验提供对未知稀疏级别的适应。 该工具箱允许将预测变量分配到逻辑分组(可能重叠,以便预测变量可以成为多个组的一部分)。 这可用于利用关于预测因子的先验知识以及它们如何相互关联(例如,将遗传数据分组为基因和基因集合,例如通路)。 现在通过实施泊松和几何回归模型支持计数回归。 为了支持带有异常值的数据分析,我们在贝叶斯线性回归的实现中提供了两个重尾误差模型:拉普拉斯和学生 t 分布误差。 大多数功能都易于使用,工具箱可以直接处理 MATLAB 表(包括自
2022-03-14 16:14:46 206KB matlab
1
采用本体(Ontology)为向量空间模型提供更为丰富、详细的概念空间,在本体的支持下,文档中的术语不再被孤立地看成关键词,而是彼此间有了一定的语义联系。以已获得丰富而详细的本体为前提,考虑当本体空间很大时,解决向量空间的高维数给计算带来复杂性与难度这一问题,提出基于HCA(Hierarchical Clustering Algorithm)的向量空间压缩算法。
2022-01-11 17:46:02 1.1MB 论文研究
1
回归模型-汽车 汽车回归建模-自动变速箱会影响MPG吗
2021-12-05 15:23:54 5KB
1
本文实例讲述了Python基于Logistic回归建模计算某银行在降低贷款拖欠率的数据。分享给大家供大家参考,具体如下: 一、Logistic回归模型:   二、Logistic回归建模步骤 1.根据分析目的设置指标变量(因变量和自变量),根据收集到的数据进行筛选 2.用ln(p/1-p)和自变量x1…xp列出线性回归方程,估计出模型中的回归系数 3.进行模型检验。模型有效性检验的函数有很多,比如正确率、混淆矩阵、ROC曲线、KS值 4.模型应用。 三、对某银行在降低贷款拖欠率的数据进行建模 源代码为: import pandas as pd filename=r'..\data\bank
2021-11-18 15:15:18 72KB c gi gis
1
金县房屋销售线性回归 金县房屋销售数据的线性回归建模 小组成员 安德鲁·穆勒(Andrew Muller) 阿舍尔·汗(Ashe Khan) 商业案例 我们将预测应该出售多少房屋,以便确定市场上的房屋是定价过低还是定价过高。 我们的客户是希望出售房屋的房主,但不知道卖多少钱。 数据分析 我们获得了column_names.md文件中该列的信息。 将所有数据转换为数值数据类型后,我们将处理所有NaN值并创建一些新功能:“ yr_since_renovation”,“ yr_since_built”和“ renovated”。 然后,我们删除不需要的功能:“视图”,“ sqft_above”,“ sqft_living15”,“ sqft_lot15”和“日期”。 清理数据后,我们开始对其进行分析。 每个变量相对于我们的目标价格的散点图显示了我们哪些变量具有明显的线性关系。 当我们开始查看
2021-11-16 01:32:53 5.24MB JupyterNotebook
1
偏最小二乘法回归建模案例.doc
2021-09-20 22:02:36 1.5MB 文档
基于聚类算法的支持向量回归建模的新策略.pdf
2021-08-21 13:03:36 296KB 聚类 算法 数据结构 参考文献