分类器的性能比较与调优: 使用scikit-learn 包中的tree,贝叶斯,knn,对数据进行模型训练,尽量了解其原理及运用。 使用不同分析三种分类器在实验中的性能比较,分析它们的特点。 本实验采用的数据集为house与segment。
南京理工大学数据挖掘课件,主要内容是有关数据挖掘和数据仓库方面的。
2022-08-11 00:30:49 5.01MB data mining
1
多得分手 允许在scikit的cross_val_score使用多个度量功能的cross_val_score 。 正如已经讨论过的那样,Python的SciKit包含了用于计算估计量评估指标的强大功能(使用cross_val_score ),但在为同一分类器计算多个指标而不进行再次训练时,它似乎失败了。 由于仅接受单个度量标准名称或单个可调用名称的函数的scoring参数而出现问题。 此存储库的模块multiscorer是一种在cross_val_score中使用任意数量的指标的解决方法。 安装 要“安装”模块,只需下载源代码并将其放置在项目的目录中即可。 (或者,下载multiscor
1
在许多实际的数据挖掘应用程序中,例如文本分类,可以轻松获得未加标签的训练示例,但获得加标签的训练示例则相当昂贵。 因此,半监督学习算法引起了数据挖掘和机器学习领域的极大兴趣。 近年来,基于图的半监督学习已成为半监督学习社区中最活跃的研究领域之一。 本文提出了一种基于线性邻域模型的新颖的基于图的半监督学习方法,该方法假设每个数据点都可以从其邻域进行线性重构。 我们的算法称为线性邻域传播(LNP),可以使用这些线性邻域以足够的平滑度将标签从标记点传播到整个数据集。 本文对LNP的性质进行了理论分析。 此外,我们还导出了一种简单的方法来将LNP扩展到样本外数据。 对于合成数据,数字和文本分类任务,提出了有希望的实验结果。
2022-08-01 16:46:33 3.37MB data mining;graph theory;learning (artificial
1
数据库管理系统概述英文版课件:18 Data Mining.ppt
2022-06-21 09:05:50 362KB 数据库
数据会议 :clinking_beer_mugs: _ .- ' ) ( ' .( OO )_ ,--. .- ' ),-----. .- ' ),-----. ,--. ,--.) | | .- ' ) ( OO ' .-. ' ( OO ' .-. ' | `. ' | | | OO )/ | | | | / | | | ||
1
matlab 10折交叉验证知识代码CSE-5334-数据挖掘 lin_regression_Matlab.txt包含线性回归Matlab代码。 lin_regression_Python.txt包含线性回归Python代码。 在ATNT50目录中,我们有 trainDataXY.txt 它包含45张图像。 来自类别1的图像1-9。来自类别2的图像10-18,以此类推。每个图像都是一列。 第一行是类别标签。 testDataXY.txt 它包含5张图片。 每个图像都是一列。 第一行是类别标签。 您使用训练数据训练分类器。 训练完分类器后,您就可以对testData中的数据进行分类,并将获得的类标签与那里提供的地面标签进行比较。 这两个数据是简单的训练和测试数据。 它们是预热数据,因此您可以看到分类器如何处理此简单数据。 数据集:ATNT-face-image400.txt: 文本文件。 第一行是群集标签。 第二端行:每列是一个特征向量(向量长度= 28x23)。 总计40个班级。 每个班级有10张图片。 总计40 * 10 = 400张图像 数据集:Hand-writing-26-le
2022-06-01 14:09:49 440KB 系统开源
1
数据挖掘标准 标准: OLE DB for DM and XML for Analysis SQL/Multimedia for Data Mining Java Data Mining API *Predictive Model Markup Language预测模型标记语言 XML格式为基础,被用于描述统计与数据挖掘模型的开放标准,令各种数据挖掘工具的定义和共享后续的预测模型成为可能,通过使用标准的XML解析器对PMML进行解析,应用程序能够知道模型输入和输出的数据类型、模型详细的格式,并且按照标准的数据挖掘术语来解释模型的结果。 *Crisp-DM 偏重于挖掘过程和周期 Common Warehouse Metadata
2022-05-24 22:43:26 1.13MB 亚信 Data Mining Report-DSD
1
Applied Predictive Modeling.2013 机器学习,数据挖掘参考资料
2022-05-14 20:59:04 13.58MB machine learning data mining
1
基于方面的情感分析 给定句子中的某个方面字词,预测该方面字词的情感标签 该项目的所有详细信息都可以在找到 MemNet代码是
1