上传者: 42102933
|
上传时间: 2021-12-29 10:10:46
|
文件大小: 864KB
|
文件类型: -
网络入侵的异常检测
资料资讯
该数据集可以从下载
降维
数据集的PCA维数减少
无监督学习
在无人监督的设置中,训练集的班级标签不可用。 在当前问题中,为了反映实际情况,在训练过程中忽略了真实标签。 因此,无监督分类模型用于预测每个记录的真实标签。 我们训练了隔离林,基于聚类的局部离群因子(CBLOF),主成分分析(PCA)和椭圆形信封。 在现实世界中无监督的问题中,由于缺乏事实依据,企业必须验证预测结果。 但是,在此问题中,预测标签已使用真实标签进行了验证,并且以下结果表明,无监督模型预测了很多正面阳性。
半监督学习
在半监督设置中,给出了一个较大的未标记数据集和一个较小的标记数据集。 目标是在整个数据集上训练分类器,该分类器将预测未标记数据点的标记。 在当前问题中,我们创建了84%的未标记数据和16%的标记数据点。 使用自我训练的半监督学习方法,我们训练了Logistic回归和随机森林