三个熵估计器
连续随机变量的熵的三个估计量(一维)
entropy_bin()使用常见的直方图方法。 除数据外,还需要指定容器宽度。
entropy_ci()使用一阶相关积分,就像niave核密度估计器一样。 除了数据外,还需要指定一个邻域半径(内核带宽),类似于直方图估计器的(一半)箱宽度。
entropy_nn()使用最近邻居距离的分布。 它不需要可调参数。
通过使用具有各种带宽的一些模拟,我的经验是,最近的邻居估计量具有最低的偏差,但方差最大。 相关积分估计器可能是最好的,尤其是在选择了很好的邻居半径的情况下。 直方图方法倾向于低估熵。 我怀疑使用高斯核的核密度估计器会更好,但是没有实现。
2022-03-04 19:30:43
5KB
Python
1