信息论中的技术通常用于选择时间序列预测或模式识别中的变量。 这些任务直接或间接地涉及输入和输出数据之间互信息的最大化。 然而,由于联合熵的计算,该过程需要大量的计算工作,这需要联合概率分布的估计。 为了避免这种计算工作,可以根据最小冗余/最大相关性原则应用变量选择,以较低的计算成本间接最大化互信息。 然而,组合优化的问题,即检查所有可能的变量组合,仍然代表大量的计算工作。 由于这种计算成本,以前的一些工作提出了一种简单的增量搜索方法,可以达到准最优解。 鉴于现有方法的局限性,开发了此代码,以使用遗传算法执行组合优化。 参数是所需的所选特征数 (feat_numb)、矩阵 X,其中每一列是一个特征向量示例,以及其各自的目标数据 y,它是一个行向量。 输出是一个向量,其中包含组成最佳特征集的特征的索引,其中特征的顺序与其重要性无关。 如需出版,请引用原著:O. Ludwig and U. Nu
2021-10-16 18:43:39
3KB
matlab
1