python的机器学习库的轮子文件,可直接pip安装,由于从国外官网下载过慢,因此提供本资源,机器学习库是很有用的,他涵盖了大部分监督学习和无监督学习的算法,本文件对应Python版本为python37的64位版本
2021-10-11 13:02:05 6.16MB scikit-learn sklearn
1
机器学习贷款贷款俱乐部 我们正在一家银行工作,正在考虑在Lending club进行投资。 由于没有标准模型,因此我们希望构建预测模型,以帮助您根据用户输入的各种参数来预测利率。 第1部分:数据整理和探索性数据分析 数据下载和预处理 我们的第一个挑战是从以编程方式下载数据。我们的目标是从网站以编程方式下载数据并为整个数据库创建一个数据集。 探索性数据分析: 使用R / Python编写Jupyter笔记本以图形方式表示不同的数据摘要。在此笔记本中总结您的发现。 总结关于不同用户配置文件,状态,贷款金额等的关键见解。创建Power BI仪表板的数据科学家视图以说明您的关键见解 第二部分:
2021-10-11 08:59:02 41.19MB docker machine-learning scikit-learn python3
1
本压缩包中包含了scikit-learn库使用教程的中英文两版。
2021-10-10 13:41:24 18.42MB scikit-learn
1
基于SciPy的众多分支版本中,最有名,也是专门面向机器学习的就是Scikit-learn
2021-10-06 16:03:16 5.41MB python scikit
1
使用机器学习和Python进行贷款预测:使用xgboost和表决汇总技术设计预测模型,并使用pandas,seaborn和matplotlib从数据中提取见解
2021-09-30 15:21:42 352KB machine-learning scikit-learn pandas seaborn
1
CSE6242数据和视觉分析(2019年Spring) 第74小组-道路交通事故预测Web应用程序 项目说明 在此项目中,我们着手提供一种预测RTA风险的工具,以解决英国伦敦的道路交通事故(RTA)问题,从而使用户可以做出有关其行驶路线的明智决定。 我们还对过去的数据和图像进行了详细分析,以更好地了解RTA。 我们的Web界面包含两个部分,即探索和交互。 在探索部分,我们介绍了我们的研究方法,所使用的算法,数据的分析和可视化。 在交互部分中,用户可以利用交互式仪表板来预测他们选择的路线中RTA的可能性。 该应用程序使用机器学习模型进行预测。 用户将必须输入日期和时间,出发地和旅行目的地。 然后,该应用程序将调用进行路线规划和天气API,进行天气预报。 这些数据随后将被输入到模型中,并且在用户路线中出现RTA的可能性将在地图上显示为危险图标。 该Web应用程序是使用Python Fla
2021-09-28 21:25:02 17.79MB HTML
1
从症状预测疾病 该项目探索使用机器学习算法来根据症状预测疾病。 探索的算法 在代码中探索了以下算法: 朴素贝叶斯 决策树 随机森林 梯度提升 数据集 源1 与main.py脚本一起使用的此问题的数据集是从此处下载的: https://www.kaggle.com/kaushil268/disease-prediction-using-machine-learning 该数据集共有133列,其中132例是患者经历的症状,以及该患者预后的最后一列。 源2 从此处下载用于Jupyter笔记本的此问题的数据集: https://impact.dbmi.columbia.edu/~friedma/Projects/DiseaseSymptomKB/index.html 该数据集包含3列: Disease | Count of Disease Occurrence | Symptom 您可以将整个表格从此处复制粘贴到excel工作表中,也可以使用Beautifulsoup将其刮下。 目录结构 |_ dataset/ |_ training_data.csv
2021-09-27 15:02:33 3.58MB machine-learning scikit-learn pandas python3
1
ubunut 系统scikit-learn框架安装指导 出现的错误解决方案
2021-09-19 19:09:34 9.18MB scikit-learn 安装指导 错误解决
1
有趣的卡格勒 我参加和即将参加的Kaggle比赛的所有参赛作品。 我可能会用Python(利用scikit-learn或类似的库)编写所有内容,但是如果可以的话,偶尔我也可能会使用R或Haskell。 因为我认为这是我的游乐场,所以在此存储库中编写的代码可能非常草率。 如果您有兴趣,请随时做出贡献。 avazu-ctr预测 Avazu的CTR预测比赛- 我的解决方案利用GradientBoostingClassifier和一些预处理/工程流程功能。 就对数损失而言,它的得分为0.4045696 ,而第一名的得分为0.3818529 (截至2014年2月2日)。 数字识别器 数字识别
2021-09-18 12:10:29 18.36MB python neural-network scikit-learn kaggle
1
scikit-learn中的单元超球面上聚类 演算法 此软件包实现了scikit-learn的Banerjee等人在JMLR 2005 概述的三种算法。 球形K均值(spkmeans) 球形K均值与常规K均值的不同之处在于,它在每个最大化步骤结束时(即归一化质心)将估计的聚类质心投影到单位球体上。 冯·米塞斯·费舍尔分布(movMF)的混合 就像通过均值和方差来参数化高斯分布一样,具有均值方向$\mu$和浓度参数$\kappa$ 。 从vMF分布得出的每个点$x_i$和平均方向$\|\mu\|_2 = 1$生活在单位超球面$\S^{N-1}$ (即$\|x_i\|_2 = 1$ )的表面上$\|\mu\|_2 = 1$ 。 较大的$\kappa$会导致点集中度更高。 如果我们的数据作为一种模式米塞斯费舍尔分布的,我们有一个额外的重量参数$\alpha$在混合物中各分布。 movMF算法通过期望最大化(EM)估计混合参数,使我们能够相应地对数据进行聚类。 软运动MF 估计每个类别的每个示例的实值后验。 从某种意义上说,这使我们可以进行软聚类,因为每个数据点都有聚类的可能性。
2021-09-17 14:48:38 896KB scikit-learn sampling k-means circular-statistics
1