泰坦尼克号csv数据,机器学习中做特征工程的样例数据
2021-06-19 13:06:14 21KB 机器学习 特征工程 泰坦尼克号
1
文档为pdf格式,对回归决策树的原理进行了详细叙述及举例说明,并包含python实现代码。
2021-06-18 15:22:11 516KB 决策树 回归 机器学习 数据挖掘
1
早间看新闻成为人们每天线上生活的开端,紧接着在通勤的路上打开电子书、淘宝或是插上耳机闭目养神都是不错的选择;午间是订餐高峰,金融支付应用也迎来使用高峰,饭毕后来一把游戏或处理几张刚拍的美食照片都是放松一下的好机会;晚间人们迎来大块的连续时间,用来玩游戏、看视频或者学习都很适合;凌晨是加班达人和蹦迪达人的打车时间,也是失眠达人和夜猫达人的音乐和视频时间,或许也有部分人在夜深人静的时候仍在回复钉钉或企业微信,也或许在反思工作不满的同时想要寻找下一家理想公司
2021-06-12 09:01:34 4.02MB 机器学习 数据算法 人工智能
Python数据分析与机器学习实战教程,该课程精心挑选真实的数据集为案例,通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家入门机器学习。学完该课程即可:1.掌握Python数据科学工具包,包括矩阵数据处理与可视化展示。2.掌握机器学习算法原理推导,从数学上理解算法是怎么来的以及其中涉及的细节。3.掌握每一个算法所涉及的参数,详解其中每一步对结果的影响。4.熟练使用Python进行建模实战,基于真实数据集展开分析,一步步完成整个建模实战任务。
1
本书主要是对机器学习算法所用数据进行预处理所涉及的各项任务
2021-06-03 18:09:51 4.75MB matlab 机器学习 数据处理
valid.json 之江电商评论观点挖掘比赛训练数据 比赛链接https://zhejianglab.aliyun.com/entrance/231731/introduction
2021-05-31 21:12:56 99KB 机器学习 数据 竞赛
1
04纽约Airbnb数据挖掘-new-york-city-airbnb-open-data.zip
2021-05-30 12:06:32 2.44MB 机器学习 数据集
1
使用到的数据集是I. Androutsopoulos, J. Koutsias, K.V. Chandrinos, George Paliouras和 C.D. Spyropoulos的 "An Evaluation of Naive Bayesian Anti-Spam Filtering"中使用到的垃圾邮件语料库:lingspam_public。 stopwords我是直接调用的,后续在文件中有另外增加无效词。 详细信息可以参看我的博文:https://blog.csdn.net/qq_43262059/article/details/117379888
2021-05-29 14:10:19 3.65MB KNN 垃圾邮件分类 机器学习 数据挖掘
1
PCA降维算法总结以及matlab实现PCA(个人的一点理解) - New begin, new .pdf 在进行图像的特征提取的过程中,提取的特征维数太多经常会导致特征匹配时过于复杂,消耗系统资源,不得不采用特征降维的方法。所谓特征降维,即采用一个低纬度的特征来表示高纬度。特征降维一般有两类方法:特征选择和特征抽取。特征选择即从高纬度的特征中选择其中的一个子集来作为新的特征;而特征抽取是指将高纬度的特征经过某个函数映射至低纬度作为新的特征。常用的特征抽取方法就是PCA。下面着重介绍PCA。
2021-05-26 15:09:05 1.59MB Python 机器学习 数据挖掘 数据分析
1
此数据集为本人整理的公开数据集,用于人脸识别模型训练、情感分析、机器学习等。数据集为人脸图片,包含不同的情绪、性别、年龄等。图片均为JPG格式,数量约2.3万张。
1