通过去除不相关和多余的特征,特征选择旨在找到具有良好泛化能力的原始特征的紧凑表示。 随着无标签数据的普及,无监督特征选择已显示出可有效减轻维数的诅咒,对于全面分析和理解无标签高维数据的无数至关重要,这是由于子空间聚类中低秩表示法的成功所致,我们提出了一种用于无监督特征选择的正则化自我表示(RSR)模型,其中每个特征都可以表示为其相关特征的线性组合。 通过使用L-2,L-1-范数来表征表示系数矩阵和表示残差矩阵,RSR有效地选择了代表性特征并确保了对异常值的鲁棒性。 如果某个特征很重要,则它将参与大多数其他特征的表示,从而导致出现大量的表示系数,反之亦然。 对合成数据和现实世界数据进行的实验分析表明,该方法可以有效地识别代表性特征,在聚类精度,冗余减少和分类精度方面优于许多最新的无监督特征选择方法。
1
介绍了情感分析中情感特征提取的难点,提出了利用模糊理论和语义模糊化对提取的特征词进行扩充,建立模糊情感语料库,通过与基于句法分析的词性选取的特征词组成的情感特征词典作对比实验,说明模糊理论适合用于网络新闻评论中情感特征词库的提取和扩充.
1
详尽搜索 这个R包的目的是提供一个易于使用,快速和可扩展的穷举搜索框架。 详尽的功能选择可能需要安装和评估大量模型。 因此,执行速度和内存管理是执行此类任务的关键因素。 该软件包通过使用多线程C ++后端解决了这两个问题。 通过仅存储最佳结果来保持内存使用率不变。 这样可以评估通常在标准设置中通常不可行的巨大任务。 安装 您可以从CRAN安装ExhaustiveSearch R软件包的发行版: install.packages( " ExhaustiveSearch " ) 当前开发版本可以从GitHub安装: devtools :: install_github( " RudolfJagdhuber/ExhaustiveSearch " ) 用法 主要功能ExhaustiveSearch()使用典型的formula和data结构,您可能会对lm()或glm()等函数熟悉。 作为
1
FEATURE SELECTION FOR KNOWLEDGE DISCOVERY AND DATA MINING
2019-12-21 21:41:31 12.74MB 特征选择
1
Feature Selection with the Boruta Package的中文翻译全文 Feature Selection with the Boruta Package的中文翻译全文 Feature Selection with the Boruta Package的中文翻译全文 利用boruta算法进行特征选择,详细的例子和算法的解释
2019-12-21 20:40:55 196KB R语言 Boruta算法
1
This article describes a R package Boruta, implementing a novel feature selection algorithm for nding all relevant variables. The algorithm is designed as a wrapper around a Random Forest classication algorithm. It iteratively removes the features which are proved by a statistical test to be less relevant than random probes. The Boruta package provides a convenient interface to the algorithm. The short description of the algorithm and examples of its application are presented. 本文介绍了一个R包Boruta,实现了一种寻找所有相关变量的新特征选择算法。 该算法被设计为包装器随机森林分类算法。 它迭代地删除了那些通过统计检验证明与随机探针不太相关特征。 Boruta包为算法提供了方便的接口。本文是对 算法的简短描述并介绍了其应用实例。
2019-12-21 18:53:19 506KB boruta算法 R语言
1