数据离散化
有些算法(如关联分析),只能处理标称型属性,这时候就需要对数值型的属性进行离散化。
对取值有限的数值型属性可通过修改.arff文件中该属性数据类型实现离散化。
例如,在某数据集中的 “children”属性只有4个数值型取值:0,1,2,3。
我们直接修改ARFF文件,把
@attribute children numeric
改为
@attribute children {0,1,2,3}
就可以了。
在“Explorer”中重新打开“bank-data.arff”,看看选中“children”属性后,区域6那里显示的“Type” 变成“Nominal”了。
2021-06-01 22:43:02
14.29MB
weka
1