泰坦尼克号的生存预测原始数据,以及Kaggle的下载网站
1
比马印第安人糖尿病数据集(Pima Indians Diabetes Dataset)涉及根据医疗记录预测比马印第安人5年内糖尿病的发病情况。 它是一个二元分类问题。每个类的观察值数量不均等。一共有 768 个观察值,8个输入变量和1个输出变量。缺失值通常用零值编码。变量名如下: 怀孕次数 口服葡萄糖耐受试验中,2小时的血浆葡萄糖浓度。 舒张压(mm Hg) 三头肌皮肤褶层厚度(mm) 2小时血清胰岛素含量(μU/ ml) 体重指数(体重,kg /(身高,m)^ 2) 糖尿病家族史 年龄(岁) 类变量(0 或 1) 预测最普遍类的基准性能是约 65% 的分类准确率,最佳结果达到约 77% 的分类准确率。
2021-09-14 18:32:55 23KB pima 机器学习 训练数据
1
机器学习实例不多,泰坦尼克号获救测试是一个比较好的,可是苦于没有训练数据,最近出去下载下来了,与诸君分享。
1