糖尿病预测系统
2022-11-18 21:28:42 1.23MB JupyterNotebook
1
txt和csv两种格式文件,包含对数据简单说明,用于糖尿病预测,判断是否患糖尿病病。
2022-11-09 13:21:23 18KB 数据集 糖尿病预测 pima
1
糖尿病预测 糖尿病预测模型 在PIMA INDIAN糖尿病数据上创建了可观的78.35%准确性的预测模型。 准确性基于模型创建中未使用的测试数据。 所使用的csv文件位于csv文件夹中,而R代码则包含在脚本文件夹中。 文件夹GUI由服务器/用户脚本组成。 所有功能可能无法在标准R程序包中运行,因此应相应安装其他程序包。 为了使服务器运行,至关重要的是要在Rstudio中加载在运行脚本时创建的相同环境。 工作目录应设置为csv文件夹。 建议明智地运行代码行。 该项目的详细文档作为“文档”包含在Word文件中。 它包含详细的过程,决策,选择,结果,比较,图解,准确性以及所有对过程的解释,理解和推理所必需的东西。
2022-10-22 17:09:24 39KB R
1
基于机器学习模型的糖尿病预测(MatlabR2020a 9个预测因子和1个目标预测)
1
本文在总结前人研究的基础上,对导致糖尿病的危险因素进行分析,通过对哈尔滨工业大学 2014 年校医院体检数据集的特征变量进行逐步回归分析,得到与糖尿病显著相关的危险因素,保留其作为 BP 神经网络模型、支持向量机模型和集成学习模型的输入变量。机器学习算法在处理较为复杂的问题上有较好的准确度和泛化能力。将样本集中 2728 条数据根据要求按照 7:2:1 的比例划分成训练集、测试集和独立样本集。基于 BP 人工神经网络、支持向量机和集成学习模型分别建立进行机器学习仿真模拟。输入变量和模型的各种参数、核函数的选择都对预测结果产生有或多或少的影响。本研究中观察了如网络结构、学习率、惩罚因子、核函数及相关参数的改变对预测结果的影响,然后经过对参数进行调试选择,找到各个算法的最优模型。最后使用独立样本进行测试,三个模型的预测结果与原始数据相关性强,证明建模具有统计意义,其中人工神经网络的最优模型的测试集 AUC 更高,运行时间更短。所以,最终选择以网络结构为 7-1-1 的人工神经网络模型为本研究中糖尿病预测的最适模型。 关键词:糖尿病;危险因素;BP 人工神经网络;支持向量机;集成学习
2022-04-27 20:07:07 1.43MB 算法 机器学习 人工智能
RUAP-糖尿病预测
2022-02-18 01:24:05 12KB C#
1
糖尿病预测:使用Cima决策树算法和K-最近模型,根据患者的实验室测试结果变量(例如葡萄糖,血压等​​),使用Pima Indians糖尿病数据集来预测患者是否患有糖尿病。 Python-Scikit学习,SciPy,熊猫,MatPlotLib
2021-12-16 17:10:02 1.87MB python data analytics scikit-learn
1
近几十年来,人们生活水平显著提高,但是健康意识依旧薄弱,不良的生活习惯和饮食习惯导致糖尿病发病人数急剧增加,由糖尿病导致的各种并发症严重威胁了人们的健康.由于糖尿病具有知晓率低的特点,很多糖尿病患者未能及时发现病症,导致出现并发症.本文通过分析糖尿病的特点,针对医疗数据样本量小、容易缺失的特点,选择IV值分析进行特征选择、使用一种新型的Boosting算法CatBoost进行糖尿病患者预测,取得了显著的预测效果.
2021-12-05 17:36:46 853KB 糖尿病 IV值分析 特征选择 集成学习
1
TianChi Diabetes Game 大赛网址: Introduction 天池精准医疗大赛,其分为三个阶段初赛、复赛和决赛。初赛的题目是针对2型糖尿病的回归问题,根据受检者的体检数据和临床信息对血糖值进行预测。复赛的题目是针对妊娠糖尿病的二分类问题,通过体检信息和基因信息预测出是否患有妊娠糖尿病。决赛是在现场进行答辩。 本人是积极向上团队中的队员,积极向上团队再精准医疗大赛中取得了初赛top-11和复赛top-6的成绩。当前代码仓库仅仅包含了本人参赛中的思路和代码,当公布初赛结果时,我发现初赛预测结果比我们提交的效果更好,后来也没有仔细分析,仅仅把当时的代码稍微整理一下。团队复赛最终提交版的天池社区技术圈:。 Path TianChi-Diabetes | |-- preliminary:初赛代码 | |-- repecharge:复赛代码 Preliminary 预处理:矩阵补全
2021-11-06 12:05:06 3.6MB Python
1