从UCI数据网站中选择成人数据库(adult),数据是从美国人口普查局数据库中提取的。这里选取一年的收入大于50k的成人数据,选取8个属性变量分别为工作环境、教育、婚姻状况、职业、关系、种族和性别,均为类别变量,如职业可为[Tech-support,Craft-repair,Other-service,Sales,Exec-managerial, Prof-specialty, Handlers-cleaners, Machine-op-inspct, Adm-clerical,Farming-fishing,Transport-moving,Priv-house-serv,Protective-serv, Armed-Forces]。可以运用关联分析找出8个属性变量中,哪些变量有关系,从而提取出一些有用信息。
2021-10-25 00:34:05
1KB
python
1