对于输入数组,这依旧是把每一行当作一个样本,每一列当作一个特征,我们先来看第一个特征,即第一列,也就是说它有两个取值 0 或者 1,那么 one-hot 就会使
2022-08-03 13:01:08 822KB 人工智能 scikit-learn
1
:deciduous_tree: Python中的斜决策树 倾斜决策树实现的python接口: OC1 CART-线性组合(Breiman等,1984,第5章) 安装(Python 3) 首先使用以下命令安装numpy : pip install numpy 然后运行: pip install git+https://github.com/AndriyMulyar/sklearn-oblique-tree 利用 可以使用普通的scikit-learn分类器api来诱导树木。 例如: from sklearn . datasets import load_iris , load_breast_cancer fro
1
Hyperopt-sklearn是基于scikit-learn项目的一个子集,其全称是:Hyper-parameter optimization for scikit-learn,即针对scikit-learn项目的超级参数优化工具。由于scikit-learn是基于Python的机器学习开源框架,因此Hyperopt-sklearn也基于Python语言。Hyperopt-sklearn的文档称:对于开发者而言,针对不同的训练数据挑选一个合适的分类器(classifier)通常是困难的。而且即使选好了分类器,后面的参数调试过程也相当乏味和耗时。更严重的是,还有许多情况是开发者好不容易调试好了选定的分类器,却发现一开始的选择本身就是错误的,这本身就浪费了大量的精力和时间。针对该问题,Hyperopt-sklearn提供了一种解决方案。Hyperopt-sklearn支持各种不同的搜索算法(包括随机搜索、Tree of Parzen Estimators、Annealing等),可以搜索所有支持的分类器(KNeightborsClassifier、KNeightborsClassifier、SGDClassifier等)或者在给定的分类器下搜索所有可能的参数配置,并评估最优选择。并且Hyperopt-sklearn还支持多种预处理流程,包括TfidfVectorizer,Normalzier和OneHotEncoder等。那么Hyperopt-sklearn的实际效果究竟如何?下表分别展示了使用scikit-learn默认参数和Hyperopt-sklearn优化参数运行的分类器的F-score分数,数据源来自20个不同的新闻组稿件。可以看到,经过优化的分类器的平均得分都要高于默认参数的情况。另外,Hyperopt-sklearn的编码量也很小,并且维护团队还提供了丰富的参考样例。 标签:Hyperopt
2022-07-25 15:45:32 57KB 开源项目
1
scikit-multiflow是一个机器学习包,用于在Python scikit-multiflow传输数据。 和正在合并到一个名为的新项目中。 我们认为这两个项目具有相同的愿景。 我们认为,集中资源而不是重复工作将使双方受益。 我们也有信心,这将使两个社区受益。 将会有更多的人从事新项目,这将使我们能够更有效地分配工作。 因此,我们将能够使用更多功能并提高项目的整体质量。 这两个项目将停止积极发展。 这两个项目的代码都将继续公开提供,尽管开发仅侧重于过渡期间的小规模维护。 新软件包的体系结构与creme非常相似。 它将专注于单实例增量模型。 我们鼓励用户使用River代替奶油。 我
1
python的机器学习库的轮子文件,可直接pip安装,由于从国外官网下载过慢,因此提供本资源,机器学习库是很有用的,他涵盖了大部分监督学习和无监督学习的算法,本文件对应Python版本为python39的64位版本
2022-07-17 23:16:19 6.39MB scikit-learn python
1
机器学习实战:基于Scikit-Learn、Keras和TensorFlow 原书第2版 配套代码
2022-07-15 22:46:17 49.95MB 机器学习
1
hpbandster-sklearn hpbandster-sklearn是一个Python库,为超参数调整库提供了包装器HpBandSterSearchCV 。 动机 HpBandSter实现了几种尖端的超参数算法,包括HyperBand和BOHB。 它们通常优于标准的随机搜索,可以在更短的时间内找到最佳的参数组合。 HpBandSter功能强大且可配置,但对于初学者来说,其用法通常是不直观的,并且需要大量的样板代码。 为了解决该问题,创建了HpBandSterSearchCV来替代scikit-learn超参数搜索器,它遵循了众所周知的流行API,从而可以以最小的设置调整scikit-
2022-07-11 16:53:48 29KB python machine-learning scikit-learn sklearn
1
When most people hear “Machine Learning,” they picture a robot: a dependable butler or a deadly Terminator depending on who you ask. But Machine Learning is not just a futuristic fantasy, it’s already here. In fact, it has been around for decades in some specialized applications, such as Optical Character Recognition (OCR). But the first ML application that really became mainstream, improving the lives of hundreds of millions of people, took over the world back in the 1990s: it was the spam filter. Not exactly a self-aware Skynet, but it does technically qualify as Machine Learning (it has actually learned so well that you seldom need to flag an email as spam anymore). It was followed by hundreds of ML applications that now quietly power hundreds of products and features that you use regularly, from better recommendations to voice search. Where does Machine Learning start and where does it end? What exactly does it mean for a machine to learn something? If I download a copy of Wikipedia, has my computer really “learned” something? Is it suddenly smarter? In this chapter we will start by clarifying what Machine Learning is and why you may want to use it. Then, before we set out to explore the Machine Learning continent, we will take a look at the map and learn about the main regions and the most notable landmarks: supervised versus unsupervised learning, online versus batch learning, instance-based versus model-based learning. Then we will look at the workflow of a typical ML project, discuss the main challenges you may face, and cover how to evaluate and fine-tune a Machine Learning system. This chapter introduces a lot of fundamental concepts (and jargon) that every data scientist should know by heart. It will be a high-level overview (the only chapter without much code), all rather simple, but you should make sure everything is crystal-clear to you before continuing to the rest of the book. So grab a coffee and let’s get started!
2022-07-08 22:31:57 39.66MB Machine Learning Scikit-Learn TensorFlow
1
sklearn-crfsuite sklearn-crfsuite 是一个瘦 ( ) 包装器,它提供了与类似的接口。 sklearn_crfsuite.CRF是一个 scikit-learn 兼容的估计器:您可以使用例如 scikit-learn 模型选择实用程序(交叉验证、超参数优化),或使用保存/加载 CRF 模型。 许可证是麻省理工学院。 文档可以在找到。
2022-07-03 20:43:11 92KB Python
1
机器学习系列6 使用Scikit-learn构建回归模型:简单线性回归、多项式回归与多元线性回归
2022-07-03 16:47:43 62KB scikit-learn 回归 机器学习 线性回归
1