赛事链接:https://challenge.xfyun.cn/topic/info?type=diabetes&ch=ds22-dw-wd01
内容概要:赛题数据由训练集和测试集组成,具体情况如下:
- 训练集:共有5070条数据,用于构建您的预测模型
- 测试集:共有1000条数据,用于验证预测模型的性能。
其中训练集数据包含有9个字段:性别、出生年份、体重指数、糖尿病家族史、舒张压、口服耐糖量测试、胰岛素释放实验、肱三头肌皮褶厚度、患有糖尿病标识(数据标签)。
在此基础上增加了两种训练策略的机器学习代码:官方的demo的ipynb代码和一个决策树实现的代码。
适用人群:初学数据挖掘、机器学习的新手
使用目标及场景:初学数据挖掘、机器学习,,提高实践技能
其他说明:学习交流。
1