上传者: 38545243
|
上传时间: 2022-01-14 10:44:24
|
文件大小: 259KB
|
文件类型: -
特征选择是提高文本分类性能的一个重要手段。论文首先定义了两种特征贡献度:一个是特征对类间文档分散程度的贡献度,该贡献度越大越好;另一种是特征对类内文档分散程度的贡献度,该贡献度越小越好。然后把这两种特征贡献度有机地结合起来设计了一个新的特征选择方法,该方法能够对所选特征进行综合考虑,从而使获得的特征集具有较好的代表性。仿真实验表明:所提特征选择方法在一定程度上能够提高文本分类性能。