辍学学生的预测
该项目的目标是确定有辍学风险的学生
介绍
从一组包含有关1000名学生的前两个学期的信息的文件中,必须将它们集成到一个文件中以进行后续分析,最后的文件必须分为三组:
100名学生进行测试
200名学生评估模型
700名学生训练模型。
学生没有被标记,因此需要对数据进行描述性分析,一旦标记了学生,就必须使用kmeans才能基于聚类分析来标记数据。 必须使用人工神经网络来训练模型,以预测哪些学生会辍学。 建立模型后,必须使用100名学生的测试数据集来了解其中哪些人会辍学,因此它将使用一种遗传算法来优化大学的资源,以便为学生提供机会,从而避免辍学。
方法
发展
变量选择和特征工程
性别:男性或女性(0或1)
admision.letras :十进制数字,代表学生在高中入学考试中的成绩。
admision.numeros :小数,表示学生在高中入学考试中的成绩。
prom
1