主成分分析是一种常用的特征选择算法, 经典方法是计算各个特征之间的相关, 但是相关无法评估变量间 的非线性关系. 互信息可用于衡量两个变量间相互依赖的强弱程度, 且不局限于线性相关, 鉴于此, 提出一种基于互 信息的主成分分析特征选择算法. 该算法计算特征间的互信息, 以互信息矩阵的特征值作为评价准则确定主成分的 个数, 并衡量主成分分析特征选择的效果. 通过实例对所提出方法和传统主成分分析方法进行比较, 并以神经网络为 分类器分析分类效果.
1
博鲁塔沙普 BorutaShap是一种包装器特征选择方法,它结合了Boruta特征选择算法和Shapley值。 事实证明,这种组合在速度和生成的特征子集的质量上都无法执行原始的排列重要性方法。 该算法不仅提供了更好的特征子集,而且还可以同时提供最准确和一致的全局特征等级,也可用于模型推断。 与原始R包(将用户限制为随机森林模型)不同,BorutaShap允许用户在特征选择过程中选择任何基于树的学习器作为基础模型。 尽管BorutaShap的运行时性能有所提高,但是SHAP TreeExplainer随观察次数线性增长,这使得它在处理大型数据集时非常麻烦。 为了解决这个问题,BorutaShap包含了一个采样过程,该过程使用算法每次迭代时可用数据的最小可能子采样。 它通过比较样本的隔离林产生的分布和使用ks-test的数据来找到该样本。 从实验来看,此过程可以将运行时间减少多达80%,同时
2021-12-04 08:27:22 2.15MB Python
1
k-匿名隐私保护模型中,k取值同时影响着k-匿名表的隐私保护程度和数据质量,因此,如何选择k值以达到隐私保护和数据质量的共赢具有重要意义.在对k取值和隐私保护、数据质量关系分析和证明的基础上,根据不同情况下的k-匿名表隐私泄露概率公式,对满足隐私保护要求的k取值范围进行了分析;根据k-匿名表的数据质量公式对满足数据质量要求的k取值范围进行了分析.根据满足隐私保护和数据质量要求的k取值之间的关系,给出了k值的优化选择算法.
1
关于TSP问题求解的综述,不错的文章,把求解TSP问题的很多方法介绍一下
2021-11-26 15:52:21 462KB TSP 克隆选择算法
1
本资源是matlab特征选择的特征选择函数库,包含大量的特征选择所需的源码,包括 relieff, ILFS等,需要的可以下载,此版本带有license。
2021-11-23 19:16:30 1.18MB featur
1
matlab 编程选择运行仿真代码 快进 该软件包是由 Sethian (1996) 首次开发的 Fast Marching Method (FMM) 的 R 实现。 尽管 FMM 被开发用于对不断变化的边界进行建模,但它可以并且已经广泛用于流体动力学、图像分割、构建 Voronoi 图、模拟扩散过程和计算最短路径。 该算法通过包括以下修改进一步扩展了 Sethian 算法: Eikonal 方程的二阶近似; Kobayashi 和 Sugihara (2001) 的先到规则; Silva 和 Steele (2012) 的附加权重,允许竞争边界在不同时间开始扩大; 和 Silva 和 Steele (2014),允许非均匀域,其中每个单元格都有自己的扩散率值。 还包括一个空间包装函数,它可以更轻松地对地理空间域中的扩散场景进行建模,正如最初设想的史前扩散研究和模拟(Silva 和 Steele 2012,2014)。 该算法是 Silva 和 Steele(2012 年、2014 年)的 MATLAB 代码的实现和改进,该代码由欧盟 (EU) 的 Horizo​​n 2020 研究和
2021-11-19 10:27:40 22KB 系统开源
1
关于线性时间选择算法的代码,使用的是C++语言。
2021-11-18 09:23:16 242KB 线性时间选择算法
1
matlab 编程选择运行仿真代码用于风电场控制的 Koopman 动态模式分解 获得机械工程理学硕士学位的论文 存储库 该存储库包含在上述硕士论文的背景下开发的所有工作。 这项工作的主要成果细分如下: Thesis.pdf :对应于最终论文,介绍了风力涡轮机控制、风电场控制、流体动力学中的数据驱动建模、动态模式分解和适用于控制的变体算法。 所有结果也包含在本文档中。 Thesis_presentation.pdf : Thesis.pdf内容的介绍。 ExtendedAbstract.pdf : Thesis.pdf的 10 页摘要,采用两列格式。 poster_thesis.pdf:在Thesis.pdf的目标和结果的海报格式摘要。 KOPMAN_IODMD_1.0 : 源代码,在 Matlab 中开发,利用国家可再生能源实验室 (NREL) 开发的现有功能,用于在Thesis.pdf 中获得结果。 动画:可以可视化数据集的动画。 文章:基于论文中开发的工作发表的文章。 data :包含用于测试Thesis.pdf 中提出的算法的数据集。 论文摘要 在风电场中将风力涡轮机安装在一起
2021-11-15 17:12:50 40.87MB 系统开源
1
线性时间选择 给定线性序集中n个元素和一个整数k,1≤k≤n,要求找出这n个元素中第k小的元素 template Type RandomizedSelect(Type a[],int p,int r,int k) { if (p==r) return a[p]; int i=RandomizedPartition(a,p,r), j=i-p+1; if (k<=j) return RandomizedSelect(a,p,i,k); else return RandomizedSelect(a,i+1,r,k-j); } 在最坏情况下,算法randomizedSelect需要O(n2)计算时间但可以证明,算法randomizedSelect可以在O(n)平均时间内找出n个输入元素中的第k小元素。
2021-10-28 21:15:41 813KB 分治法
1
基于高光谱影像数据的特点,分析了高光谱数据的降维方法。着重探讨了波段选择的若干算法:熵及联合熵、最佳指数因子、自动子空间划分、自适应波段选择、波段指数和最优波段指数等算法。分析了各种算法的有效性、局限性和计算复杂度,并针对波段指数的不足,设计了最优波段指数(OBI)波段选择新算法。最后通过具体的试验,验证了各种算法的性能。
1