CoForest is a semi-supervised algorithm, which exploits the power of ensemble learning and large amount of unlabeled data available to produce hypothesis with better performance.
2021-05-22 20:31:05 6KB 半监督学习算法
1
利用K均值聚类算法对灰度图像进行聚类,四维数组存储和运算数据,运行时间慢
2021-05-22 17:07:22 217KB 模式识别 非监督学习 K均值聚类 python
1
压缩包中包含算法的Python实现代码、测试数据集及运行结果,可供感兴趣的同学参考。因为现在的实现并不能对所有的数据集都得到良好的效果,所以如果哪位同学有更好的想法,希望能不吝赐教。
2021-05-14 08:12:39 190KB 机器学习 聚类算法 无监督学习
1
半监督学习生成对抗网络的Tensorflow实现
2021-05-11 10:06:34 19.76MB Python开发-机器学习
1
Airbnb定价预测 在Python中监督学习模型,以预测Airbnb房源的每晚价格。 决策树,随机森林,XGBoost,AdaBoost和堆栈。
2021-05-10 09:57:40 2.94MB JupyterNotebook
1
模式识别方法首先要解决的一个问题就是特征选择,目前许多方法考虑了有监督学习的特征选择问题,对无监督学习的特征选择问题却涉及得很少。依据特征对分类结果的影响和特征之间相关性分析两个方面提出了一种基于K-均值聚类方法的特征选择算法,用于无监督学习的特征选择问题。
1
国科大 徐君 网络数据挖掘 大作业 个人报告+代码+数据,可参考 README 运行环境: Python 2.7.12 jieba 0.39 numpy 1.13.3 scikit-learn 0.19.1 scipy 1.0.0 请参照此运行环境进行运行前配置。 1.运行TextProcess.py获得classifiedLabel.txt、trainSetMsg.txt以及testSetMsg.txt,得到文本处理后的规则文本数据文件; 2.运行crossValidation.py进行交叉验证; 3.其中SVM算法运行时间较长(6-7小时左右),可以注释掉或者减少数据规模来测试; 4.可调用分类器中的predict方法来利用训练后的分类器进行分类预测(垃圾短信识别)。
2021-05-07 18:27:55 66.33MB 网络数据挖掘 垃圾短信识别 分类器
1
在监督学习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和输出之间有着一个特定的关系。这么说可能理解起来不是很清晰,没关系,后面有具体的例子。监督学习可分为“回归”和“分类”问题。监督学习分类在回归问题中,我们会预测一个连续值。也就是说我们试图将输入变量和输出用一个连续函数对应起来;而在分类问题中,我们会预测一个离散值,我们试图将输入变量与离散的类别对应起来。下面举两个例子,就会非常清楚这几个概念了。通过房地产市场的数据,预测一个给定面积的房屋的价格就是一个回归问题。这里我们可以把价格看成是面积的函数,它是一个连续的输出值。但是,当把上面的问题改为“预测一个给定面积的房
1
在最新AAAI 2020的邀请嘉宾报告上,Facebook人工智能总监、图灵奖得主Yann Lecun给了自监督学习的报告《Self-Supervised Learning 》,44页ppt,介绍了深度学习面临的挑战,自监督学习的光明前景,基于能量学习的因变量模型,介绍最新自监督学习的进展与问题,是非常值得看的报告。
2021-05-03 23:04:16 30.37MB Self-Supervised
1
移动通讯客户Kmeans聚类分析练习数据集Excel格式,适用于机器学习入手练习,xlsx格式,适合多种数据分析工具
1