上传者: 42131414
|
上传时间: 2021-11-07 11:01:20
|
文件大小: 4KB
|
文件类型: -
大车
分类和回归树(CART)C ++实现
目录
介绍
资料格式
介绍
CART是分类树和回归树的C ++实现,这是DM(数据挖掘)的著名算法。 这是此实现的源代码。
资料格式
培训和测试数据文件的格式为:
::...。 。 。
每行包含一个实例,并以'\ n'字符结尾。
是一个浮点值,指示分类中的类ID,或者指示回归中的因变量值。 类ID的范围应从1到类的大小。 例如,对于4类分类问题,类ID为1、2、3和4。 因变量值保持的范围在实数集内。
和:以'\ t'字符分隔。 是表示要素ID的正整数。 功能ID的范围应从1到功能集的大小。 例如,如果要素集的尺寸为10,则要素ID为1、2,... 9或10。索引必须按升序排列。 是表示要素值的浮点数。
如果特征值等于0,则出于存储空间和计算速度的考虑,建议忽略:。
测试文件中的标签仅用于计算准确性或错误。 如果它们未知,则只需在第一