连续属性离散化算法比较研究.pdf
2022-07-12 09:12:32 1.54MB 文档资料
这是CAIM算法的实现。 仅提供一种功能。 任何更正或改进,请告诉我。 更正....****
2022-03-27 10:29:59 3KB matlab
1
对于numeric类型的数据,基本贝叶斯分类算法并不能直接应用。对于需要分类的数据,首先按照信息熵进行离散化后。之后对于处理过后的数据,使用基本贝叶斯分类算法进行训练和分类。
2022-03-20 10:53:57 4KB 贝叶斯分类器 离散化算法 信息熵
1
从数据库中提取知识的任务通常由机器学习算法执行。 多数的这些算法只能应用于由离散数字或名义属性(特征)描述的数据。 在连续属性的情况下,需要一种将连续属性转换为离散属性的离散化算法。 此代码基于论文:“CAIM Discretization Algorithm”,详细信息可查找该论文[1]。 你可以从“ControlCenter.m”开始,在这里你会找到一个简单的例子,并附有说明。 如果有任何问题,请告诉我。 我会尽快回复你。 [1] Kurgan, L. 和 Cios, KJ,2004 年。CAIM 离散化算法。 IEEE 知识与数据工程汇刊,16(2):145-153
2022-03-09 16:46:49 1.8MB matlab
1
离散化算法在数据挖掘和知识发现中发挥了重要作用。 它们不仅能对连续属性进行简明的总结,帮助专家更轻松地理解数据,还能让学习更准确、更快。 我们实现的 CACC 算法是基于论文 [1]。 至于代码,可以先打开“ControlCenter.m”,这里有一个简单的例子,还有一个酵母数据库。 此文件中也包含说明。 如果有任何问题,请告诉我,我会尽快帮助您。 [1]Cheng-Jung Tsai、Chien-I Lee、Wei-Pang Yang:一种基于类-属性权变系数的离散化算法。 信息科学178(3): 714-731 (2008)
2022-02-20 12:35:40 1.8MB matlab
1
探讨了贪心及其改进算法、基于属性重要性、基于信息熵和基于聚类四类连续属性离散化算法,并通过实验验证这四类算法的离散化效果。实验结果表明,数据集离散化的效果不仅取决于使用算法,而且与数据集连续属性的分布和决策数据值的分类也有密切关系。
1
在数字化过程中,需要对曲线进行采样简化,即在曲线上取有限个点,将其变为折线,并且能够在一定程度上保持原有的形状。
2021-05-22 14:40:05 688KB 曲线离散化 Douglas Peucker 算法
1