pima_diabetes:预测21岁以上的Pima女性受试者的糖尿病。 通过UCI机器学习可获得的数据
2022-05-29 14:42:45 7KB
1
糖尿病预测因子 根据世界卫生组织的资料,糖尿病是世界上主要的死亡原因之一。 糖尿病是一种代谢性疾病,其分类为高血糖,可导致心脏,肾脏,胰腺和更多器官的损害。 鉴于胰腺不能产生足够的胰岛素,当身体无法使用产生的胰岛素时,就会发生糖尿病。 根据世卫组织的数据,2016年估计有160万人死于糖尿病。 该笔记本调查了使用基于Python的机器学习和数据科学库的情况,以尝试建立一种能够根据其医疗属性预测某人是否患有糖尿病的机器学习模型。 问题定义 对疾病早期阶段的糖尿病的预测可以导致医生可以使用的更好的治疗方法,这可以借助机器学习和数据分析来实现。 该评估的目的是建立一种机器学习模型,以根据患者的医疗属性预测患者是否患有糖尿病。 由于糖尿病预测变量只有两个输出,因此考虑到它涉及确定样本是否属于一个类别或另一个类别,因此将其视为二进制分类。 数据 我使用的数据来自UCI机器学习存储库中的Pima印度
2022-05-26 11:19:27 189KB JupyterNotebook
1
Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set Pima Indians Diabetes Data Set
2022-05-14 12:05:18 154B 机器学习 pima indians
1
糖尿病预测用KNN
2022-05-07 19:28:13 13KB JupyterNotebook
1
糖尿病预测应用 通过使用机器学习算法来预测糖尿病的应用程序。 它由Flask构建并部署在Heroku上。 在这个项目中,我们的目标是根据怀孕,血糖,血压,皮肤厚度,胰岛素,BMI,糖尿病谱系功能,年龄等各种特征来预测患者是否患有糖尿病。 我们将执行从数据收集到模型部署的所有步骤。 在模型评估期间,我们根据precision_score指标比较各种机器学习算法,并找到最佳算法。 然后,我们使用Flask(这是一个python微框架)创建一个Web应用。 部署-https: 截屏 安装 克隆此存储库并解压缩。 下载后,将cd放入flask目录。 使用Python 3开始一个新的虚拟环境并激活它。 使用pip install -r requirements.txt安装所需的软件包 执行命令: python app.py 在浏览器中打开http链接。
2022-04-27 15:26:20 319KB HTML
1
引文 文章: : 如果您发现此存储库对您的研究有用,请引用此工作: Martinsson, J., Schliep, A., Eliasson, B. et al. J Healthc Inform Res (2019). https://doi.org/10.1007/s41666-019-00059-y 先决条件 该代码旨在在OhioT1DM数据集上运行。 因此,要使用它(例如,示例实验YAML配置)中的xml_path需要指向XML数据文件所在的磁盘上的路径。 例如,更改“ / home / ubuntu / ohio_data / OhioT1DM-training /”以指向包含ohio数据集XML文件的Ohiot1DM-training文件夹。 当然可以编写一个新的数据集模块,该模块将数据加载为所需格式并在其他数据上训练模型。 安装 $> chmod +x setup
1
医疗保健行业包含非常大的敏感数据,需要非常小心地处理。 糖尿病是世界范围内日益严重的致命疾病之一。 医疗专业人员需要一个可靠的预测系统来诊断糖尿病。 不同的机器学习技术可用于从不同角度检查数据并将其概括为有价值的信息。 如果应用某些数据挖掘技术,海量数据的可访问性和可用性将能够为我们提供有用的知识。 主要目标是确定新模式,然后解释这些模式,为用户提供重要且有用的信息。 糖尿病会导致心脏病、肾病、神经损伤和失明。 以有效的方式挖掘糖尿病数据是一个至关重要的问题。 将发现数据挖掘技术和方法,以找到适当的方法和技术,以对糖尿病数据集进行有效分类并提取有价值的模式。 在这项研究中,医学生物信息学分析已经完成以预测糖尿病。 WEKA 软件被用作诊断糖尿病的挖掘工具。 Pima Indian 糖尿病数据库来自用于分析的 UCI 存储库。 对该数据集进行了研究和分析,以建立一个预测和诊断糖尿病疾病的有效模型。 在这项研究中,我们旨在应用自举重采样技术来提高准确性,然后应用朴素贝叶斯、决策树和 (KNN) 并比较它们的性能。
2022-01-10 00:41:10 261KB Healthcare Diabetes
1
pytorch深度学习(7):处理多维特征输入--文章中用到的数据集
2021-11-30 17:13:41 52KB pytorch 人工智能 python 神经网络
1
糖尿病_毫升 通过机器学习预测糖尿病的存在
2021-11-27 10:08:53 78KB Python
1
标题 作者 日期 输出 自述文件 2021年3月16日 html_document 目的 该代码探索了2009-2010年美国国家健康与营养检查调查(NHANES)中糖化血红蛋白水平与社会经济因素之间的各种关联,给出了包含多个人口统计数据和临床变量的截短的.csv文件。 设置 要使用此代码,请使用随附的NHANES_diabetes_2009-10.csv文件。 栏名 描述 ID 应答者序号 Gender 男/女 Age 年岁 Ethnicity 种族/民族 Family_income 以美元为单位的家庭收入 Meds 受访者正在服用胰岛素或糖尿病药物? DM_or_PreDM 受访者是否患有DM或PreDM诊断? Weight 公斤重量 Height 站立高度,以厘米为单位 BMI 体重指数 Upper_Leg_Length 大腿长度,以厘米为单位 Uppe
2021-11-16 21:17:23 208KB R
1