使用Python负责任的机器学习 训练可解释机器学习(ML)模型,解释ML模型以及调试ML模型的准确性,辨别力和安全性的技术示例。 概述 随着越来越多的经济体接受自动化和数据驱动的决策,使用人工智能(AI)和ML模型可能会变得越来越普遍。 尽管这些预测系统可能非常准确,但它们常常是难以理解且不受欢迎的黑匣子,它们仅产生数字预测,而没有附带的解释。 不幸的是,最近的研究和最近的事件引起了人们对脆弱的AI和ML系统中数学和社会学缺陷的关注,但是从业人员通常没有正确的工具来撬开ML模型并对其进行调试。 本系列笔记本介绍了几种方法,这些方法可以提高ML模型的透明度,责任感和可信赖性。 如果您是数据科学家或分析师,并且想要训练准确,可解释的ML模型,向您的客户或经理解释ML模型,测试这些模型的安全漏洞或社会歧视,或者您担心文档,验证或法规方面的问题要求,那么本系列Jupyter笔记本非常适合您! (
2021-11-16 23:21:24 10.74MB python data-science machine-learning data-mining
1
用于测试的数据集合,配套https://github.com/zhangxinxing/basic_of_datamining
2021-11-11 20:08:03 26MB data mining 数据集
1
入侵检测 使用各种数据挖掘技术的入侵检测(KDD Cup 1999数据) 数据集位于 使用的技术: K均值(K = 59) 准确度93.077% 精确 召回 F1分数 支持 攻击。 0.95 0.96 0.96 250436 正常。 0.83 0.80 0.82 60593 平均/总计 0.93 0.93 0.93 311029 决策树 准确度92.956% 精确 召回 F1分数 支持 攻击。 1.0 0.91 0.95 250436 正常。 0.74 0.99 0.85 60593 平均/总计 0.95 0.93 0.93 31
2021-11-10 17:02:43 116.68MB machine-learning data-mining scikit-learn python3
1
space object dataset for data mining( can be opened by weka), classification: satellite, debris,rocket. Download from http://satellitedebris.net/Database in 2014-08-31. There are attributes of Space object like norad id, radar cross section, area to mass ratio, orbital parameters, size, etc.
2021-11-08 22:06:41 102KB space object dataset
1
Python数据挖掘 《 Python数据分析与挖掘实战》原始码和学习总结 第1章数据挖掘基础 第2章Python数据分析简介 第3章数据探索 第4章数据预处理 第5章挖掘建模 第6章电力窃漏电用户自动识别 第7章航空公司客户价值分析 第8章中医证型关联规则挖掘 第9章基于水色图像的水质评价 第10章家用电器用户行为分析与事件识别 第11章应用系统负载分析与磁盘容量预测 第12章电子商务网站用户行为分析及服务推荐 第13章财政收人影响因素分析及预测模型 第14章基于基站定位数据的商圈分析 第15章电商产品评论数据情感分析
2021-11-08 14:52:02 319.24MB 系统开源
1
分类是数据挖掘、机器学习和模式识别中一个重要的研究领域。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较,总结出了各种算法的特性,为使用者选择算法或研究者改进算法提供了依据。 解决分类问题的方法很多 ,单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机和基于关联规则的分类等;另外还有用于组合单一分类方法的集成学习算法,如Bagging和Boosting等。
2021-10-31 15:42:40 255KB data mining classfication
1
MatrixProfile MatrixProfile是Matrix Profile Foundation为您提供的Python 3库,用于挖掘时间序列数据。 Matrix Profile是一种新颖的数据结构,具有由UC-Riverside的Keogh和Mueen研究小组和新墨西哥大学开发的相应算法(踩踏,体制,主题等)。 该库的目的是通过标准化核心概念,简化的API和合理的默认参数值,使新手和专家都可以使用这些算法。 除了此Python库之外,Matrix Profile Foundation还提供了其他语言的实现。 这些语言具有相当一致的API,使您可以轻松地在它们之间进行切换,而无需花费大量学习时间。 tsmp -R实现 go-matrixprofile -Golang实现 Python支持 当前,我们支持以下版本的Python: 3.5 3.6 3.7 3.8 3
2021-10-29 18:50:30 4.38MB python data-science data-mining time-series
1
Data Mining - Practical Machine Learning Tools and Techniques (3rd Ed)
2021-10-28 23:46:03 6.68MB 数据挖掘
1
2017-CCF-BDCI-Enterprise 这是我的第一个数据挖掘比赛,CCF 大数据与计算智能大赛(BDCI)中的一题:。最终取得复赛 A 榜第 3,B 榜第 9 (Top 1.58%) 的成绩。 这个比赛 12 月中旬就结束了,硬是被我拖到现在才来总结,我这拖延症真的是……现在回忆起这个比赛,比赛时的那种郁闷感依然记忆犹新。我在复赛的第 5 天便达到了分数 6924,但之后一直无法提分,这种烦躁感当时给我带来了挺大的困扰(当然最后还是提升到了分数 6930)。等比赛结束之后,我回过头来看,其实当时我参赛的心态是不端正的,功利心太强,这样带来的问题就是比赛心态的爆炸,自己的眼界会被约束,提分方式的想象力也会被限制。最好的心态应该是抱着学习的心态参赛,只要能够学到一点点新的东西,就会感到惊喜。 另外一个想说的点是,我们团队在复赛 A 榜中排名第 3,但是切换 B 榜之后,便跌到第 9
2021-10-27 09:53:53 21KB data-mining ccf binary-classification 2017
1
用关键字捕捉推文 通过该项目,您可以使用Twitter API使用输入的单词和日期从API中提取数据。 输出示例 入门 这些说明将为您提供在本地计算机上运行并运行的项目的副本,以进行开发和测试。 先决条件 Python 2.7和Pip 正在安装 git clone https://github.com/dogukanayd/Catch-Tweet-with-Keyword.git cd Catch-Tweet-with-Keyword pip install -r requirements.txt 在settings.py中输入您自己的密钥 YOUR_CONSUMER_KEY = 'Y
2021-10-26 11:21:03 178KB python data-science data-mining social-media
1