一个sklearn中的轮子,网上直接下载巨慢,建议本地下载安装,可用在树莓派上,教程可以见我博客,或者直接QQ联系我
2021-04-14 22:26:50 48.65MB sklearn 机器学习 深度学习
1
转载请注明出处:https://editor.csdn.net/md?articleId=104839136 文章目录主成分分析(PCA)Sklearn库中PCA一、参数说明(Parameters)二、属性(Attributes)三、方法(Methods)四、示例(Sample)五、参考资料(Reference data) 主成分分析(PCA) 主成分分析(Principal components analysis,以下简称PCA)的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征(新的坐标系)。这k维特征称为主元,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-
2021-04-14 22:04:51 165KB ar le pca
1
《机器学习实战: 基于Scikit-Learn和Tensorflow》的高清英文带书签原版
2021-04-13 15:09:06 7.20MB tensorflow sklearn
1
KMeans算法和Elbow准则 “ k-Means聚类背后的想法是获取一堆数据并确定数据中是否存在任何自然聚类(相关对象的组)。 k-Means算法是所谓的无监督学习算法。 我们事先不知道数据中存在什么模式-它没有形式分类-但我们想知道是否可以将数据以某种方式分为几类。 例如,您可以使用k-Means通过告诉像素根据其颜色值将像素分组为3个群集来查找图像中3种最突出的颜色。 或者,您可以使用它将相关新闻文章分组在一起,而无需事先确定要使用的类别。 该算法将自动找出最佳组。 k均值中的“ k”是一个数字。 该算法假定数据中存在k个中心,各个数据元素分散在周围。 最接近这些所谓质心的数据将被分类或分组在一起。 k-Means不会告诉您每个特定数据组的分类器是什么。 将新闻文章分成几组后,并不能说第一组是关于科学的,第二组是关于名人的,第三组是关于即将举行的选举的,等等。您只知道相关的新闻故事现在在一起了,但不一定是什么这种关系意味着。 k均值仅有助于寻找潜在的集群。” -取自对算法的移植。 存储库包含: 将的模型拟合到。 使用“肘标准”为K-means算法确定最佳聚类数的
2021-04-11 10:21:11 100KB python machine-learning scikit-learn sklearn
1
sklearn机器学习源码(黑皮书) 常用算法原理及编程实战
2021-04-08 18:39:25 36.81MB 机器学习
1
sklearn学习资料
2021-04-07 11:03:12 151.85MB sklearn
1
sklearn实现多元线性回归及多项式回归,个人学习笔记,简单易懂,实现多项式回归
2021-04-05 10:28:11 19KB sklearn
1
通过flink和随机森林模型实时识别驾驶员用户是否处于警惕状态,并进行进一步数据统计和分析,将分析结果保存在hbase,并通过Websocket向用户提供实时的分析结果。 后端技术栈:Flink,Flume,kafka,HBase,Mysql,Springboot 前后端通信协议:websocket(stomp),http(前端axios) 前端技术栈:Vue,Echart,ElementUI 机器学习:sklearn,pmml
2021-04-03 19:02:23 28.53MB flink sklearn springboot 机器学习
1
@python,sklearn,svm,遥感数据分类,代码实例 python_sklearn_svm遥感数据分类代码实例 (1)svm原理简述 支持向量机(Support Vector Machine,即SVM)是包括分类(Classification)、回归(Regression)和异常检测(Outlier Detection)等一系列监督学习算法的总称。对于分类,SVM最初用于解决二分类问题,多分类问题可通过构建多个SVM分类器解决。SVM具有两大特点:1.寻求最优分类边界,即求解出能够正确划分训练数据集并且几何间隔最大的分离超平面,这是SVM的基本思想;2.基于核函数的扩维变换,即通过核
2021-04-03 17:08:00 93KB ar le python
1
MovieLens 100K上的概率矩阵分解 总览 在此项目中,我们使用MovieLens 100K数据集。 该数据集包含来自943位用户的1,682部电影的100,000个评分。 在此项目中,RMSE(均方根误差)用作度量。 我测试了2种不同的数据分割:密集和稀疏。 数据是随机拆分的,用于训练/验证的数据为80%,对于密集数据的测试为20%,对于稀疏数据,仅训练/验证的数据为20%,对于测试为20%。 在训练中,应用5倍交叉验证来选择最佳超参数并在测试集中评估模型。 运行代码 参量 任务:[“ task1”-调整正则化参数,“ task2”-调整因子数量,“ predict”-预测等级]
2021-04-02 13:43:10 328KB scikit-learn sklearn matrix-factorization sparse
1