数据来自墨西哥的国家,秘鲁和哥伦比亚,年龄在14至61和不同的饮食习惯和身体状况,有17属性和信息处理2111条记录。与饮食习惯相关的属性有:频繁摄入高热量食物(FAVC)、蔬菜摄入频率(FCVC)、主餐次数(NCP)、餐间食物摄入(CAEC)、每日用水量(CH20)、饮酒量(CALC)。与身体状况相关的属性为:卡路里消耗监测(SCC)、体育活动频率(FAF)、使用科技设备时间(TUE)、使用交通工具(MTRANS),获得的其他变量为:性别、年龄、身高和体重。标签变量为NObesity,其值为:不足体重、正常体重、超重I级、超重II级、肥胖I级、肥胖II级和肥胖III级。
该数据集为UCL开源数据集,无需授权即可使用。
主要适用Pandas库进行数据分析,是使用Python进行大数据分析入门的很好示例教材。