从症状预测疾病
该项目探索使用机器学习算法来根据症状预测疾病。
探索的算法
在代码中探索了以下算法:
朴素贝叶斯
决策树
随机森林
梯度提升
数据集
源1
与main.py脚本一起使用的此问题的数据集是从此处下载的:
https://www.kaggle.com/kaushil268/disease-prediction-using-machine-learning
该数据集共有133列,其中132例是患者经历的症状,以及该患者预后的最后一列。
源2
从此处下载用于Jupyter笔记本的此问题的数据集:
https://impact.dbmi.columbia.edu/~friedma/Projects/DiseaseSymptomKB/index.html
该数据集包含3列:
Disease | Count of Disease Occurrence | Symptom
您可以将整个表格从此处复制粘贴到excel工作表中,也可以使用Beautifulsoup将其刮下。
目录结构
|_ dataset/
|_ training_data.csv
1