《 Python机器学习及实践:从零开始创造Kaggle竞赛之路(第2版)》开源数据和代码 本书的数据集,工具和代码:DIY_ML_Systems_with_Python_2nd_Edition 第二版概要: 《 Python机器学习实践(第二版)》一书适合所有对(深度)机器学习(Machine Learning),数据挖掘(Data Mining),以及自然语言处理(Natural Language Processing)的技术实践研究的初学者。 本书从零开始,以Python编程语言为基础,在不重复叙述大量数学模型与复杂编程知识的替代下,逐步将读者逐步熟悉并掌握当下最流行的(深度)机器学习,数据挖掘以及自然语言处理的开源工具库(包):Scikit学习,Google Tensorflow,Pandas,Matplotlib,NLTK,Gensim,XGBoost,OpenAI Gym等。
2022-01-08 10:44:30 295.19MB 系统开源
1
ultrasound-nerve-segmentation, Kaggle超声神经分割竞赛 [Keras ] 基于Keras的超声神经神经网络Kaggle超声神经分割竞赛 [Keras ]#Install ( {14,16}, GPU )需要 cuDNN 。###Theanohttp://deeplearning.net/softwar
2022-01-08 00:51:09 24KB 开源
1
Kaggle实战之信用卡盗刷预测
2022-01-06 22:05:12 2.63MB ALOT
1
Kaggle语音识别 这是针对的Kaggle竞赛的项目,目的是为简单的语音命令构建语音检测器。 该模型是使用连接器时间分类(CTC)成本的卷积残差,向后LSTM网络,由TensorFlow编写。 首先将音频波文件转换为滤波器组频谱图。 CNN层从频谱图输入中提取分层特征,而LSTM层的作用类似于编码器/解码器,对CNN特征的序列进行编码,并输出字符作为输出。 LSTM编码器/解码器非常动态。 取决于训练词汇,可以用整个单词,音节或仅音素的信息对发出的字符进行编码。 完全连接的层会压缩表示形式,并进一步将字符与单词解耦。 该项目旨在调试和可视化友好。 提供这些界面以权重和激活,登录TensorBoard并记录示例单词的学习,这些示例单词显示了如何在训练中学习角色和决策边界。 安装和使用: 先决条件:Python 3.5,TensorFlow 1.4; 或Python 3.6,Tens
2022-01-06 13:45:16 1.93MB tensorflow kaggle lstm speech-recognition
1
使用Python机器学习进行年龄检测 使用Kaggle的收入评估数据集进行年龄检测 用于训练模型的值输入值:-“性别”,“工作类别”,“教育”,“婚姻状况”,“职业”,“关系”,“每周工作时间”,“本国”, '收入','Col1','Col2','Col3','Col4','Col5'输出-年龄 机器学习算法:从sklearn.svm导入随机森林分类器 来自sklearn.metrics的precision_score以计算模型的准确性
2022-01-06 09:33:44 19KB JupyterNotebook
1
kaggle-driver-telematics-analysis Kaggle竞赛“驾驶员远程信息处理分析”。 makefeatures.py-将所有路线的77个要素组成一个numpy数组。 merge.py-将来自2种不同算法的结果合并到csv中。 randomforest.py-使用随机森林从numpy的77个特征数组中进行预测 svm.py-使用svm从77个功能的numpy数组进行预测 我最好的结果是来自没有合并的randomforest的0.91051(125th / 1528)-前10%。 svm并将rf与svm合并产生了较差的结果(0.87060和0.90004)
2022-01-05 14:48:37 5KB Python
1
糖尿病性视网膜病变-手动筛查与算法 最近几个月我一直在参加。 有关快速介绍,请参见 。 根据糖尿病患者的眼睛图像,我们必须找到一种算法来对疾病的级别进行分级。 随着比赛的进行,我越来越相信自动筛选确实很有帮助。 计分系统是 。有趣的是,有几支得分为85或更高的球队。 根据有关Kappa的文献,85表示我们的算法非常好。 。 现在我们来讨论主要问题。 该算法必须匹配医生提供的标签。..但是,医生会犯错误..结果是,有时算法在进行正确的预测时有时会“缩编”。 这就是为什么我不愿将放在网上的原因。 这样做的想法是让人们对算法的预测和决策者给出的标签发表评论。 总而言之,我们可能会对自动筛选的实际使用有更好的了解。 也许github对此并不理想。 如果您有更好的平台,请随时拨叉,以获得更好的体验! 行:医生给的标签列:按算法预测的标签 Pred 0 Pred 1 Pred 2 Pre
2022-01-04 16:35:44 15.95MB
1
CreditCardFraud-Kaggle-Tensorflow 使用来自Kaggle的信用卡欺诈数据集,我创建了一个完全连接的神经网络,该网络可以预测信用卡欺诈,平均准确性为96%
2022-01-04 16:23:43 2KB JupyterNotebook
1
科比布莱恩特20年职业篮球生涯中的投篮命中率相关数据。
2022-01-03 09:55:44 680KB Kaggle 体育数据 篮球比赛数据
1
添加正则化项,是指在损失函数上添加正则化项,而正则化项可分为两种: 一种是L1正则化项,另一种是L2正则化.我们把带有L2正则化项的回归模型称为岭回归,带有L1正则化项的回归称为Lasso回归.1.岭回归引用百度百科定义.岭回归(英文名:ridgeregression,Tikhonov regularization)是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得
1