上传者: 42136826
|
上传时间: 2022-03-06 11:48:49
|
文件大小: 2KB
|
文件类型: -
半监督的svm
数据科学分配解决方案。 使用支持向量机作为基础分类器的半监督分类器的实现。 该数据集是在代码中随机生成的。
依存关系:
麻木
斯克莱恩
分类问题
给定数据:
大量未标记的数据
少量标注数据
能够正确标记未标记数据集中任何样本的人类专家,其费用与新标记样本的数量成正比
目标:
降低成本
提高分类器的准确性
解决方案
该解决方案将具有最高置信度的预测标签添加到标签数据集中。 置信度最低的标签表明分类器需要人工专家的帮助。 这些真实的标签将添加到数据集中,并且成本会增加。 人类专家的提示数量不能超过标记样本的初始数量-标记数据的数量只能加倍。 如果准确性为100%,成本达到先前说明的限制或没有将任何样本添加到标记的数据集中,则算法终止。
例子
设置:
数据集:10000个样本,3个类,每个类2个类,3个信息性特征。
最大限度。 迭代次数:100
数据集中未标记数据的