适用于python学习; 机器学习; 算法学习; 源代码;
2022-07-01 14:06:26 34.12MB 机器学习 python sklearn
B站课程《菜菜的机器学习sklearn》的配套教材和代码,老师讲解的很详细的课程,十分推荐。 课程链接:https://www.bilibili.com/video/BV1vJ41187hk?spm_id_from=333.337.search-card.all.click&vd_source=b8df0b3923b7bb6a73c8e66c9038159d
2022-06-29 18:05:28 161.55MB python 机器学习 sklearn 菜菜
1
本文来自于csdn,本文中使用sklearn中的IRIS(鸢尾花)数据集来对特征处理功能进行说明。有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面: 特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。首次接触到sklearn,通常会被其丰富且方便的算法模型库吸引,但是这里介绍的特征处
2022-06-10 10:56:05 177KB 特征工程(sklearn)
1
菜菜的sklearn机器学习完整版(课件、代码、ipynb) 01决策树课件数据源码 02随机森林 03数据预处理和特征工程 04主成分分析PCA与奇异值分解SVD 05逻辑回归与评分卡 06聚类算法Kmeans 07支持向量机上 08支持向量机下 09回归大家族:线性回归,岭回归,Lasso与多项式回归 010朴素贝叶斯 011XGBoost
2022-06-04 22:06:01 157.52MB 机器学习 sklearn 文档资料 综合资源
1
在GitHub上面也能找到,自己去拷贝出来就好了sklearn/datasets/data/boston_house_prices.csv
2022-05-29 15:28:06 134KB
1
人工智能-项目实践-情感分析-基于朴素贝叶斯实现的豆瓣影评情感分析 语料来自与豆瓣Top250排行榜中的影评,基于Scrapy抓取,大约5w条影评,好评差评各占50%。 训练集与测试集4:1,结果准确率约为80%-79%之间。 因为电影评论中有很大一部分好评中会有负面情感的词语,例如在纪录片《海豚湾》 我觉得大部分看本片会有感的人,都不知道,中国的白暨豚已经灭绝8年了,也不会知道,长江里的江豚也仅剩1000左右了。与其感慨,咒骂日本人如何捕杀海豚,不如做些实际的事情,保护一下长江里的江豚吧,没几年,也将绝迹了。中国人做出来的事情,也不会比小日本好到哪儿去。 所以说如果将这种类似的好评去除,则可以提高准确率。
2022-05-25 10:05:21 3.26MB 人工智能 文档资料 情感分析 sklearn
第2章 特征工程 2(自我学习集) 2.1. 数据集 2 2.1.1. 可用数据集 2 2.1.2. sklearn数据集 4 2.1.3. 数据集的划分 6 2.2. 特征工程介绍 7 2.2.1. 为什么需要特征工程(Feature Engineering) 8 2.2.2. 什么是特征工程 8 2.2.3. 特征工程的位置与数据处理的比较 8 2.3. 特征抽取 9 2.3.1. 特征提取 10 2.3.2. 字典特征提取 10 2.3.3. 文本特征提取 12 2.4. 特征预处理 20 2.4.1. 什么是特征预处理 20 2.4.2. 归一化 21 2.4.3. 标准化 24 2.5. 特征降维 26 2.5.1. 降维 27 2.5.2. 降维的两种方式 27 2.5.3. 什么是特征选择 28 2.6. 主成分分析 36 2.6.1. 什么是主成分分析(PCA) 36 2.6.2. 案例:探究用户对物品类别的喜好细分降维 40 2.7. 总结 42 2.8. 作业 43 2.9. END 44
2022-05-21 11:06:18 9.33MB 深度学习 机器学习
1
第3章 分类算法 3 3.1. 数据集介绍与划分 3 3.1.1. 数据集的划分 3 3.1.2. sklearn数据集介绍 4 3.2. sklearn转换器和估计器 6 3.2.1. 转换器和估计器 6 3.3. K-近邻算法 8 3.3.1. K-近邻算法(KNN) 9 3.3.2. 电影类型分析 9 3.3.3. K-近邻算法API 11 3.3.4. 案例:鸢尾花种类预测 11 3.3.5. K-近邻总结 13 3.4. 模型选择与调优 13 3.4.1. 为什么需要交叉验证 14 3.4.2. 什么是交叉验证(cross validation) 14 3.4.3. 超参数搜索-网格搜索(Grid Search) 14 3.4.4. 鸢尾花案例增加K值调优 15 3.4.5. 案例:预测facebook签到位置 17 3.4.6. 总结 19 3.5. 朴素贝叶斯算法 19 3.5.1. 什么是朴素贝叶斯分类方法 20 3.5.2. 概率基础 21 3.5.3. 条件概率与联合概率 22 3.5.4. 贝叶斯公式 23 3.5.5. API 25 3.5.6. 案例:20类
2022-05-21 11:06:18 9.16MB 机器学习 深度学习
1
one-hot编码的作用 使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点 将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。 sklearn的一个例子 from sklearn import preprocessing enc = preprocessing.OneHotEncoder() enc.fit([[0, 0, 3], [1, 1, 0], [0, 2
2022-05-21 02:03:39 42KB ar hot le
1
内容概要: 模式识别大作业,模式识别之male_female+人脸识别实验作业——分任务python代码,基于普通python代码及sklearn实现,包括贝叶斯分析,一维及二维正态分布数据处理,Fisher线性判别,及PCA数据降维原理相关代码,人脸识别PCA降维及最近邻、k近邻算法等(内含实验数据) 效果:代码均实际实验过,可以跑通,且自带实验准确率计算以及具体标签验证可视化 只需提前安装好sklearn、scipy等包即可成功运行。
2022-05-18 19:08:00 46.7MB python 模式识别 sklearn
1