用于信息检索的代价敏感排序学习算法研究.pdf
2022-07-12 09:13:07 3.73MB 文档资料
大数据-算法-针对类别不平衡和代价敏感分类问题的特征选择和分类算法.pdf
2022-05-08 14:07:01 5.7MB 算法 big data 分类
以分类精度为目标的传统分类算法通常假定:每个样本的误分类具有同样的代价且每类样本数大致相等.但现实数据挖掘中该假定不成立时,这些算法的直接应用不能取得理想的分类和预测.针对此缺隙,并基于标准的SVM,通过在SVM的设计中集成样本的不同误分类代价,提出代价敏感支持向量机(CS-SVM)的设计方法.实验结果表明CS-SVM是有效的.
2022-04-26 22:04:15 343KB 分类  支持向量机  代价
1
传统数据挖掘分类算法在不平衡数据集上分类效果不佳,可以将代价敏感思想与传统分类算法相结合解决不平衡数据分类问题.但在代价敏感学习中,代价的确定需要足够的先验知识,难以把握.针对上述不足,构造针对不平衡数据分布的自适应代价函数,引进全局代价矩阵,对传统的朴素贝叶斯分类算法进行改进.在UCI数据集上的实验结果表明,提出的基于代价敏感的朴素贝叶斯分类算法对于不平衡数据分类是有效可行的.
1
在微博谣言检测中,对微博谣言进行正确标注需要耗费大量的人力和时间,同时数据类别的不平衡也影响了微博谣言的正确识别。为了解决该问题,提出一种基于Co-Forest算法针对不平衡数据集的改进方法,利用SMOTE算法和分层抽样平衡数据分布,并通过代价敏感的加权投票法来提高对未标记样本预测的正确率。该方法只需要对少量训练数据实例进行谣言类别标注即可有效检测谣言。10组UCI测试数据和2组微博谣言的实证实验证明了算法有效性。
1
集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学习在不平衡数据分类的优势,针对不平衡数据的集成分类算法得到广泛研究。详细分析了不平衡数据集成分类算法的研究现状,比较了现有算法的差异和各自存在的优点及问题,提出和分析了有待进一步研究的问题。
1
基于卷积神经网络的代价敏感软件缺陷预测模型.pdf
2021-09-25 22:05:44 1.48MB 神经网络 深度学习 机器学习 数据建模
关于代价敏感随机森林的参考文章,主要针对非平衡的数据集
2021-05-11 15:00:53 30.94MB 代价敏感 随机森林 文献
1
本算法基于weka实现的误分类代价和测试代价基于id3算法的实现。
2020-01-03 11:34:21 6KB 代价敏感 决策树 机器学习
1
代价敏感分类算法的几种基于c4.5算法的扩展算法的实验比较
2020-01-03 11:19:34 531KB 代价敏感
1