只为小站
首页
域名查询
文件下载
登录
基于Hadoop的数据挖掘技术在测光红移上的研究
天文数据量以指数量级快速增长,使得天文数据挖掘面临前所未有的挑战。分布式集群技术和云计算平台的飞速发展,为海量数据处理和分析提供了新的研究思路和方法。其中基于内存计算的Hadoop分布式集群技术更是异军突起,并在迭代式机器学习和交互式数据挖掘应用等方面表现出明显的优势。基于最新释放的斯隆数字巡天测光数据集研究基于Hadoop平台的数据挖掘技术在海量天文巡天数据上的适用性和应用问题,为海量天文数据挖掘提供了新的手段和方法。
2023-12-26 18:52:27
282KB
数据挖掘
1
数据分析实战 - 线性回归-女性身高与体重数据分析
使用python,利用简单线性回归模型和多项式回归模型对女性身高与体重的数据进行建模分析与改进,步骤包括数据读入、数据理解、数据准备、模型训练、模型评价、模型调参、模型预测等。
2023-12-24 01:15:44
629KB
数据分析
线性回归
数据挖掘
python
1
基于大数据的房价数据可视化分析预测系统
房地产是促进我国经济持续增长的基础性、主导性产业,二手房市场是我国房地产市场不可或缺的组成部分。由于二手房的特殊性,目前市场上实时监测二手房市场房价涨幅的情况较少,影响二手房价的因素错综复杂,价格并非呈传统的线性变化。 本项目利用Python实现某一城市二手房相关信息的爬取,并对爬取的原始数据进行数据清洗,存储到数据库中,通过 flask 搭建后台,分析影响二手房房价的各类因素,并构建递归决策树模型,实现房价预测建模。
2023-12-16 22:08:54
58B
数据挖掘
机器学习
网络爬虫
1
R语言期末大作业(全面带报告,带数据集)/ 期末限时半价
按照后期进行数据分析的需求,对数据进行预处理。 -描述性统计:选择合适的方法对数据进行统计分析。包括对数值型和类别型属性的统计,并对分析结果进行图形化的展示(使用ggplot2或者lattice包)。 -推断性统计:选择合适的假设检验方法,分析属性间的相关性、两组数据间是否具有显著性差异,分析结果并给出结论及必要的图形展示。 - 数据挖掘 根据数据特征及需求,利用分类、聚类或时间序列方法挖掘蕴含在数据中的模式及必要的图形展示,用回归模型预测走势 注意:对聚类结果分析聚簇特征 对分类结果计算准确性。 使用时间序列分析方法可判断数据是否存在趋势、周期性等特征,或对数据进行预测。 (分类、聚类、时间序列,回归模型至少使用2种方法)
2023-12-15 14:41:58
3.36MB
r语言
开发语言
数据挖掘
数据分析
KNN算法教学ppt全面
KNN算法教学ppt全面 邻近算法,或者说K最邻近(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法 该方法的不足之处是计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最邻近点。目前常用的解决方法是事先对已知样本点进行剪辑,事先去除对分类作用不大的样本。另外还有一种 Reverse KNN法,它能降低KNN算法的计算复杂度,提高分类的效率 [2] 。 KNN算法比较适用于样本容量比较大的类域的自动分类,而那些样本容量较小的类域采用这种算法比较容易产生误分
2023-12-03 11:10:20
4.16MB
数据挖掘
1
袁博-数据挖掘理论与算法
袁博-数据挖掘理论与算法
2023-11-20 20:14:53
43.25MB
数据挖掘
1
数据挖掘实战聚类分析的资源
数据挖掘实战聚类分析的资源,包括城市消费因素的数据集和k-means,k-medoids,层次聚类,Som四种聚类分析算法的代码。
2023-11-04 19:41:52
7KB
聚类算法
kmeans算法
kmedoids
层次聚类
1
2022年企业数字化转型互联网大数据解决方案PPT合集(22份).zip
2022年企业数字化转型互联网大数据解决方案PPT合集(22份)包含如下文档: 5G MEC与边缘计算与边缘计算及应用 PPT课件【93页】.pptx 中台战略-企业数字化转型的思考.pptx 中国企业数字化智能化研究报告.pptx 产业互联网发展趋势及机会分析.pptx 企业云数据中心解决方案.pptx 企业数字化转型规划设计.pptx 信息化技术架构规划.pptx 制造业数字化转型解决方案及应用.pptx 大数据分析平台总体架构方案.pptx 大数据安全规划总体方案.pptx 大数据治理平台建设与应用解决方案.pptx 大数据治理解决方案.pptx 大数据治理运营整体解决方案.pptx 大数据资源平台建设可行性研究方案.pptx 工业互联网基本概念及关键技术.pptx 数字化、智能化车间规划与建设.pptx 数字化学校建设解决方案及.pptx 数字化转型:集团企业信息化规划方案.pptx 智慧机房建设整体解决方案.pptx 智慧物联一体化运维管理平台方案.pptx 核心网5GC业务流程培训课件.ppt 面向5G承载创新解决方案.ppt
2023-10-18 14:49:42
312.67MB
数据分析
大数据
数据挖掘
企业数字化转型
数据挖掘与数据化运营实战 思路、方法、技巧与应用
这本数来自阿里内部人员,希望对大家有用
2023-10-16 17:17:15
4.26MB
电子书
1
树叶分类竞赛数据集classify-leaves_kaggle
kaggle网站深度学习竞赛资源:树叶分类竞赛数据集
2023-10-14 21:27:45
196.75MB
分类
深度学习
数据挖掘
人工智能
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于LSTM模型的股票预测模型_python
商用密码应用与安全性评估——霍炜.pdf
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
2020年大学生数学建模竞赛C题省一论文(包括材料和代码)
token登录器.rar
拾荒者.exe同时ID扫描器IP扫描器
Python+OpenCV实现行人检测(含配置说明)
长江流域shp.zip
Autojs 例子 源码 1600多个教程源码
多目标优化算法(四)NSGA3的代码(MATLAB)
狂神说Java系列笔记.rar
2019西门子杯六部十层电梯群控参考程序.zip
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
计算机专业实习日记+实习周记+实习总结
IEEE 39节点系统的Simulink模型
最新下载
spark期末复习题总结
数据库课程设计(学生宿舍管理系统)附sql文件、源代码和Word模板
Fastadmin-V1.0.0.20200506_beta-源码
【HarmonyOS】HarmonyOS应用开发者高级认证96分 分享题库
Visual C++ 2010学习版
android studio使用NanoHTTPD 创建 http 服务器打开html并使用webView打开页面
2018年上海交大软件学院优才夏令营机试题目
游戏陪玩语音聊天系统v3.0 独立版本源码
Direct12龙书
二维传热数值计算matlab程序
其他资源
多摩川编码器读取程序,STM32
[BUPT]数据结构平时实验 源代码 + 实验报告整合资源包(计算机学院 - 大二上).zip
URL采集工具V2.1
VS2017+IVF2018.docx
[Python]利用python实现复杂网络的博弈(0)——Introduction
教师课堂用语 激励语.doc
结合稀疏的GPS探测数据和社交媒体数据计算城市交通拥堵
gmeter:gmeter自定义HTTP RESTful客户端和HTTP RESTful服务器并通过配置运行它们。 借助变量和命令系统支持,json充当脚本语言来处理HTTP请求和响应-源码
Diffie–Hellman密钥交换算法.zip
dell通用网卡驱动.rar
《OSGI原理与最佳实践》源代码.zip
springSecurity开发安全的rest服务
C#下载器Demo
Visual_C++_数据采集与串口通信测控应用实战_源程序
SL会员商城
基于C++Builder6.0的图书信息管理系统的设计
myeclipse9.0
国标GB28181设备测试demo
【源码】C#动态编译DLL到内存,并调用执行
WPF通过UserControl动态生成向导示例