房地产是促进我国经济持续增长的基础性、主导性产业,二手房市场是我国房地产市场不可或缺的组成部分。由于二手房的特殊性,目前市场上实时监测二手房市场房价涨幅的情况较少,影响二手房价的因素错综复杂,价格并非呈传统的线性变化。         本项目利用Python实现某一城市二手房相关信息的爬取,并对爬取的原始数据进行数据清洗,存储到数据库中,通过 flask 搭建后台,分析影响二手房房价的各类因素,并构建递归决策树模型,实现房价预测建模。
2023-12-16 22:08:54 58B 数据挖掘 机器学习 网络爬虫
1
按照后期进行数据分析的需求,对数据进行预处理。 -描述性统计:选择合适的方法对数据进行统计分析。包括对数值型和类别型属性的统计,并对分析结果进行图形化的展示(使用ggplot2或者lattice包)。 -推断性统计:选择合适的假设检验方法,分析属性间的相关性、两组数据间是否具有显著性差异,分析结果并给出结论及必要的图形展示。 - 数据挖掘 根据数据特征及需求,利用分类、聚类或时间序列方法挖掘蕴含在数据中的模式及必要的图形展示,用回归模型预测走势 注意:对聚类结果分析聚簇特征   对分类结果计算准确性。   使用时间序列分析方法可判断数据是否存在趋势、周期性等特征,或对数据进行预测。 (分类、聚类、时间序列,回归模型至少使用2种方法)
2023-12-15 14:41:58 3.36MB r语言 开发语言 数据挖掘 数据分析
基于卷积-长短期记忆网络加注意力机制(CNN-LSTM-Attention)的时间序列预测程序,预测精度很高。 可用于做风电功率预测,电力负荷预测等等 标记注释清楚,可直接换数据运行。 代码实现训练与测试精度分析。
2023-12-11 12:30:03 285KB 网络 网络 lstm
1
KNN算法教学ppt全面 邻近算法,或者说K最邻近(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法 该方法的不足之处是计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最邻近点。目前常用的解决方法是事先对已知样本点进行剪辑,事先去除对分类作用不大的样本。另外还有一种 Reverse KNN法,它能降低KNN算法的计算复杂度,提高分类的效率 [2] 。 KNN算法比较适用于样本容量比较大的类域的自动分类,而那些样本容量较小的类域采用这种算法比较容易产生误分
2023-12-03 11:10:20 4.16MB 数据挖掘
1
基于注意力机制attention结合长短期记忆网络LSTM时间序列预测,LSTM-Attention时间序列预测,单输入单输出模型。 运行环境MATLAB版本为2020b及其以上。 评价指标包括:R2、MAE、MSE、RMSE等,代码质量极高,方便学习和替换数据。
2023-12-01 23:39:28 26KB 网络 网络 matlab lstm
1
基于遗传算法优化BP神经网络(GA-BP)的时间序列预测,matlab代码。 模型评价指标包括:R2、MAE、MSE、RMSE和MAPE等,代码质量极高,方便学习和替换数据。
2023-12-01 15:36:09 29KB 神经网络 matlab
1
基于Jonswap谱的随机波浪时间序列,有不同位置处的波高时间序列,不同时间段不同位置处的波压力三维序列。
2023-11-28 17:05:59 161KB python
1
基于VMD-Attention-LSTM的时间序列预测模型(代码仅使用了一个较小数据集的训练及预测,内含使用使用逻辑,适合初学者观看,模型结构是可行的,有能力的请尝试使用更大的数据集训练)
2023-11-27 16:48:52 5.26MB lstm VMD 时间序列预测 预测算法
1
代码实现了将时间序列根据所给符号类别数等概率划分成多个区间,根据所给字节长度数实现时间序列到符号化频次直方图序列的转换,并包含一个简单样本的转化实现
2023-11-24 15:56:10 2KB python 时间序列 数据处理
1
袁博-数据挖掘理论与算法
2023-11-20 20:14:53 43.25MB 数据挖掘
1