上传者: 17011893
|
上传时间: 2021-09-14 18:32:55
|
文件大小: 23KB
|
文件类型: TXT
比马印第安人糖尿病数据集(Pima Indians Diabetes Dataset)涉及根据医疗记录预测比马印第安人5年内糖尿病的发病情况。
它是一个二元分类问题。每个类的观察值数量不均等。一共有 768 个观察值,8个输入变量和1个输出变量。缺失值通常用零值编码。变量名如下:
怀孕次数
口服葡萄糖耐受试验中,2小时的血浆葡萄糖浓度。
舒张压(mm Hg)
三头肌皮肤褶层厚度(mm)
2小时血清胰岛素含量(μU/ ml)
体重指数(体重,kg /(身高,m)^ 2)
糖尿病家族史
年龄(岁)
类变量(0 或 1)
预测最普遍类的基准性能是约 65% 的分类准确率,最佳结果达到约 77% 的分类准确率。