针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法.该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的K-means聚类算法将数据集划分成微聚类,并检测微聚类的离群点.通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度.
1
香农在1948年在《通信的数学理论》里面提出了bit用来计算信息的度量并且提出了香农熵的计算公式,在这将这篇文章分享给大家,关于信息熵的那一部分重要内容,可以参考个人博客,在博客中给出了部分摘录和补充。
2021-11-12 10:49:02 1.1MB 信息论 信息熵 KL散度
1
关于求熵、相对熵、互信息的C语言一般算法,好资源大家共享! 关于求熵、相对熵、互信息的C语言一般算法,好资源大家共享!
2021-10-31 12:41:01 2KB 条件熵 互信息
1
一、实验目的: 1.复习MATLAB 的基本命令,熟悉MATLAB 下的基本函数。 2.复习信息熵基本定义, 能够自学图像熵定义和基本概念。 二、实验内容与原理:实验内容:1.能够写出MATLAB 源代码,求信源的信息熵。 2.根据图像熵基本知识,综合设计出MATLAB 程序,求出给定图像的图像熵。
2021-10-29 22:35:03 771B 实验 信息熵与图像熵计算
1
《机器学习》决策树学习笔记,根据数据集生成决策树,并以json格式存储。目前没有做可视化展示部分,需要以后完善
1
香农信息熵的计算(例1和例2分别为两种不同类型的输入)以及互信息的计算(例3)。其中log默认为自然对数。 #例1: 计算香农信息熵(已知概率分布) #例2: 计算香农信息熵(此时给定了信号发生情况) #例3: 计算互信息(输入:给定的信号发生情况,其中联合分布已经手工给出)
2021-10-22 16:46:49 2KB python 信息熵
1
用matlab写的一个求决策属性信息熵的小程序
2021-10-16 16:42:51 222B matlab 信息熵
1
数据挖掘信息熵问题,里面有相应的算法代码。
2021-10-14 13:41:19 4.04MB 数据挖掘 信息熵
1
探讨了贪心及其改进算法、基于属性重要性、基于信息熵和基于聚类四类连续属性离散化算法,并通过实验验证这四类算法的离散化效果。实验结果表明,数据集离散化的效果不仅取决于使用算法,而且与数据集连续属性的分布和决策数据值的分类也有密切关系。
1