现在,需要根据该学校提供的数据,对数据进行分析,并尝试找到预测模型的性能进行分析。 资源中包含:论文、代码以及数据! 方法要求: a) 分析该数据集的数据缺失情况; b) 分析该数据集不同年份各门课程的描述性统计量,并进行比对分析; c) 对该数据集进行数据清洗,处理缺失值; d) 对该数据集进行归一化; e) 要求分别利用sklearn提供的线性回归(Linear Regression)、岭回归(Ridge Regression)、鲁棒回归(使用Huber Regression)、支持向量回归(SVR)、最近邻回归(Nearest Neighbors Regression)、决策树回归(Decision Trees)、神经网络回归(Neural Network Regression)共七种回归算法实现对成绩的预测。 f) 并对训练出的七种回归器进行性能评估,利用测试集计算七种回归器的四项性能指标:解释方差、平均绝对误差、平均平方误差和中位绝对误差。
2022-04-03 16:09:32 3.32MB 数据挖掘 机器学习 人工智能 python
1
Web日志数据挖掘技术及应用,喜欢数据挖掘的可以下来看看哦
2022-03-19 14:24:52 842KB WEB 日志 数据挖掘
1
面向小白的统计学:描述性统计,均值、中位数、正数、方差、标准差。
2022-03-17 16:55:18 142.73MB 均值 中位数
1
基于数据挖掘技术的图书信息化管理研究.docx
2022-02-21 09:01:02 19KB 解决方案
1
数据仓库与数据挖掘技术课件-夏火松,含有(1-10单元)
2022-02-20 15:36:07 4.46MB 数据仓库 数据挖掘技术 课件 夏火松
1
一、为什么需要进行可扩展性研究? 1训练集大,准确率上升 2为了寻找到小事件情况 3其他需要 多大的数据量? 100M-1G 二、什么是可扩展性? 时间复杂度: 和记录个数、属性之间的关系。 对空间的需求: 避免超过主存的情况。 模型结果的质量: 质量不能明显的降低。
2022-02-05 09:13:52 174KB 数据挖掘 算法 big data
基本概念 类Apriori生成候选算法 FreeSpan算法,PrefixSpan算法 相似性搜索 其他
2022-02-05 09:13:51 727KB 数据挖掘 big data 算法
电子商务推荐系统简介 电子商务推荐系统技术介绍 基于关联规则的推荐算法 基于最近邻居的协同过滤算法 基于项目的协同过滤算法
2022-02-05 09:13:51 272KB 数据挖掘 big data 算法
【主要内容】 序列模式简介 GSP算法 PrefixSpan算法
2022-02-05 09:13:50 553KB 数据挖掘 算法 big data
使用约束的必要性 在数据挖掘中常使用的几种约束: 知识类型约束:指定要挖掘的知识类型 如关联规则 数据约束: 指定与任务相关的数据集 Find product pairs sold together in Vancouver in Dec.’98. 维/层次约束:指定所用的维或概念结构中的层 in relevance to region, price, brand, customer category. 规则约束:指定要挖掘的规则形式(如规则模板) 单价 (price $200). 兴趣度约束:指定规则兴趣度阈值或统计度量 如 (min_support ? 3%, min_confidence ? 60%).
2022-02-05 09:13:50 292KB 数据挖掘 big data 算法