00_随机森林案例一:宫颈癌预测. 01. Bagging&Boosting算法应用在回归模型中 02_Adaboost案例一:Adaboost分类算法 03_Adaboost案例二:Adaboost API algorithm参数取值比较
2021-07-24 16:06:53 213KB 机器学习算法 机器学习
1
EconML:用于基于ML的异构处理效果估计的Python包 EconML是一个Python软件包,用于通过机器学习从观察数据中估计异构处理效果。 此软件包是作为Microsoft Research的一部分设计和构建的,目的是将最新的机器学习技术与计量经济学相结合,以使自动化解决复杂的因果推理问题。 EconML的承诺: 在计量经济学和机器学习的交集中实现文献中的最新技术 保持建模效果异质性的灵活性(通过诸如随机森林,增强,套索和神经网络之类的技术),同时保留对所学模型的因果解释,并经常提供有效的置信区间 使用统一的API 建立在用于机器学习和数据分析的标准Python软件包的基础上 机器学习的最大希望之一就是在众多领域中自动化决策。 许多数据驱动的个性化决策方案的核心是对异构处理效果的估计:对于具有特定特征集的样本,干预对感兴趣结果的因果关系是什么? 简而言之,该工具包旨在测量某些治疗变量T对结果变量Y的因果效应,控制一组特征X, W以及该效应如何随X 。 所实施的方法甚至适用于观测(非实验或历史)数据集。 为了使估计结果具有因果关系,有些方法假定没有观察到的混杂因素(即, X,
2021-07-24 09:25:45 17.34MB machine-learning economics econometrics causality
1
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件,包括以下文件 data/news.csv jieba_dict/dict.txt.big jieba_dict/stopwords.txt jieba_dict/stopwords_s.txt
2021-07-19 15:41:33 3.94MB 新闻数据集 自然语言处理数据集
1
03_案例三:K-Means算法和Mini Batch K-Means算法效果评估.ipynb6.85 kB3 分钟前 02_案例二:K-Means算法和Mini Batch K-Means算法比较.ipynb227 kB3 分钟前 01_案例一:K-Means算法聚类.ipynb
2021-07-19 15:07:40 38.45MB 机器学习 聚类 K-Means
1
myLearn make:生成可执行文件 demo.sh:调试入口 model.conf:模型参数 从线性到非线性模型 1、线性回归,岭回归,Lasso回归,局部加权线性回归 2、logistic回归,softmax回归,最大熵模型 3、广义线性模型 4、Fisher线性判别和线性感知机 5、三层神经网络 6、支持向量机 统计概率模型 1、高斯判别分析 2、朴素贝叶斯 3、隐马尔可夫模型 4、最大熵马尔科夫模型 5,条件随机场 6,马尔科夫决策过程 树模型 1、决策树 ID3,C4.5,CART 2、随机森林RF 3、Adaboost 4、GBDT 5、XGboost 6、孤立森林(异常检测) 聚类模型 1、层次聚类 2、原型聚类-K-means 3、模型聚类-GMM 4、EM算法-LDA主题模型 5、密度聚类-DBSCAN 6、图聚类-谱聚类 特征工程 1、特征工程 2、特征提取 3、特
2021-07-15 22:47:49 18.25MB hmm log svm crf
1
机器学习算法之KNN 2、KNN案例:鸢尾花数据分类
2021-07-14 14:08:30 54KB 机器学习 KNN
1
可以用来做回归
2021-07-13 17:08:27 7.36MB SVM
1
波塞冬 软件定义的网络态势感知 波塞冬始于两个IQT Labs: 和。 该项目的目标是探索一种方法,以更好地识别给定(计算机)网络上的节点并了解它们在做什么。 该项目利用软件定义网络和机器学习来自动捕获网络流量,从流量中提取相关特征,通过经过训练的模型进行分类,传达结果,并提供采取进一步行动的机制。 尽管该项目最有效地利用了现代SDN,但它的部分内容仍可以与数据包捕获(pcap)文件一起使用。 目录 背景 波塞冬(Poseidon)项目最初是作为一项实验来测试,以测试利用SDN和机器学习技术检测异常网络行为的优点。 (请阅读下面链接的我们的,以了解其多年背景)。尽管这个长期目标仍然存在,但不幸的现实是,用于ML训练的丰富,标签化,公共和MODERN网络数据集的状态非常差。 我们的实验室正在努力提高网络训练集的可用性,但是在短期内,该项目仍将重点放在1)提高识别节点IS的准确性(基于捕获的IP标头数据)和2)将Poseidon开发为“利用”以容纳其他使用案例的机器学习技术。 (阅读:不只是我们的!) 先决条件 -Poseidon和相关组件在Docker之上运行,因此了解基础知识对于
2021-07-07 11:27:23 425KB docker security machine-learning automation
1
Machine-Learning-Geological-Mapping-Soil-Geochemistry:机器学习项目,可使用土壤样本地球化学来预测潜在的地质情况。 测试地形数据,采样方法,机器学习算法和多个分类器系统的优势
2021-06-30 21:13:32 31KB Python
1
关于主成分分析PCA算法解释较为清晰明了的PPT与代码,非常适合小白入门,以及作为面试的准备,有助于快速提升机器学习基础算法
1