Breast cancer survival.sav 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:03 38KB R spss
1
优点:基于微波雷达的成像工具箱(MERIT)是免费的开源软件,用于基于微波雷达的成像。 包括入门指南和示例数据,MERIT是一个灵活,可扩展的框架,用于开发,测试,运行和优化基于雷达的成像算法
2022-03-20 14:51:32 456KB matlab radar matlab-toolbox breast-cancer
1
乳腺癌检测应用 使用机器学习XGBoost分类器的乳腺癌检测应用程序
2021-12-31 09:32:00 1.93MB HTML
1
与所有其他癌症相比,乳腺癌是女性发生的第二大癌症。 2004 年记录了大约 110 万例病例。观察到这种癌症的发病率随着工业化和城市化以及早期检测设施的增加而增加。 它在高收入国家仍然更为常见,但现在在包括非洲、亚洲大部分地区和拉丁美洲在内的中等和低收入国家Swift增加。 在所有病例中,乳腺癌是致命的,并且是女性癌症死亡的主要原因,占全球所有癌症死亡人数的 16%。 本研究论文的目的是提出一份关于乳腺癌的报告,我们利用这些可用的技术进步来开发乳腺癌存活率的预测模型。 我们使用了三种流行的数据挖掘算法(朴素贝叶斯、RBF 网络、J48)来开发使用大型数据集(683 例乳腺癌病例)的预测模型。我们还使用了 10 倍交叉验证方法来测量无偏估计用于性能比较目的的三个预测模型。 结果(基于平均准确度乳腺癌数据集)表明,朴素贝叶斯是最好的预测器,对保持样本的准确度为 97.36%(该预测准确度比文献中报道的任何预测准确度都要好),RBF 网络出来了第二个以 96.77% 的准确率,J48 以 93.41% 的准确率排在第三位。
2021-12-19 13:23:16 394KB Breast cancer data
1
使用机器学习进行乳腺癌诊断 该项目的目的是采用UCI机器学习存储库中的乳腺癌威斯康星州(诊断)数据集,并应用Logistic回归,朴素贝叶斯,支持向量机,决策树和多层感知器等机器学习模型来提取特征可能最适合预测癌症性质的数据集。 目的是对乳腺癌是良性还是恶性进行分类。 确定基于模型预测的模型的准确性,以相互分析和比较生成的模型,并从模型中选择最佳模型。 多层感知器是测试过的模型中最准确的模型,准确度为97.2%。
2021-12-16 17:06:04 1.45MB JupyterNotebook
1
作为全球女性中最常见的癌症之一,乳腺癌引起了研究人员的最多关注。 经证实,准确及早发现乳腺癌可以增加患者采取正确治疗方案并长期生存的机会。 本文旨在探讨可用于从常规血液分析数据预测乳腺癌的生物标志物的范围。 支持向量机(SVM)已经为癌症分类领域做出了重要贡献。 然而,不同的核函数配置及其参数会显着影响 SVM 分类器的性能。 为了提高 SVM 分类器对乳腺癌诊断的分类精度,本文提出了一种新的癌症分类算法,该算法基于使用网格搜索算法的智能算法优化 SVM 分类器的相关参数这些参数是: 高斯径向基函数 (GRBF) 核SVM分类器的参数g和C惩罚参数。 我们的实验表明,使用网格搜索的 SVM 参数优化总是在给定范围内找到接近最佳的参数组合,以评估所提出模型的性能,使用取自 UCI 库的乳腺癌科英布拉数据集。 在这个数据集时代,使用了体重指数 (BMI)、葡萄糖、胰岛素、稳态模型评估 (HOMA)、瘦素、脂联素、抵抗素和趋化因子单核细胞趋化蛋白 1 (MCP1) 属性。 在该数据集上将所提出方法的性能与其他方法的性能进行比较。 获得的结果显示了对最先进算法的改进,具有改进的性能参数,例如疾病预测准确性、灵敏度和更好的 F1 分数等。 资金声明:作者表示,这项研究没有获得外部资金。利益声明:作者声明没有利益冲突。道德批准声明:不需要。
2021-12-15 15:39:06 1.17MB breast cancer; machine learning;
1
进行乳腺癌诊断的预测分析 使用Python中的K-Means聚类和随机森林算法
2021-11-18 00:26:10 14.22MB JupyterNotebook
1
决策树 对新患者进行分类的乳腺癌数据集的决策树。 训练数据 该模型是使用699例乳腺癌患者的数据集构建的。 数据集经过归一化和清洗,最终使500名患者接受了培训和测试的最终数据集。 共有500例患者,其中262例(52.4%)患有良性肿瘤,238例(47.6%)患有恶性肿瘤。 为了进行训练,使用了80%的数据,其中40%是良性肿瘤,40%是恶性肿瘤,其余20%用于测试。 在这20%中,12.4%来自良性肿瘤,而7.6%来自恶性肿瘤。 怎么跑 克隆存储库 启动你的服务器 现在,您可以从“决策树”中访问预测结果。 要查看命中率,请inspecionar并检查console 。 注释 src目录中的decision-tree.js文件已从以下存储库中删除,该存储库允许使用和修改: :
1
WPBC(预后)数据集包含 198 条患者记录,其中 4 条记录中缺少属性“淋巴结”状态的值。由于淋巴结值是决定乳腺癌状态的重要因素。 最终数据集包含 194 条记录,其中 148 条为非复发病例,46 条为复发病例。
2021-11-09 18:15:21 108KB UCI WPBC
1
matlab图片叠加的代码乳腺癌图像分割 使用U-Net CNN架构的三阴性乳腺癌(TNBC)数据集的语义分割 有关主要实现,请参见Main.ipynb 大纲 介绍 三阴性乳腺癌 “三阴性乳腺癌(TNBC)约占所有乳腺癌的10%至15%。这些癌症在非裔美国40岁以下的女性中更常见。 三阴性乳腺癌与其他类型的浸润性乳腺癌的不同之处在于,它们的生长和扩散速度更快,治疗选择有限且预后较差(结果) 。”-美国癌症协会 因此,需要早期癌症检测以向患者提供适当的治疗并降低由于癌症而导致的死亡风险,因为在后期检测这些癌细胞会导致更多的痛苦并增加死亡机会。 癌细胞图像的语义分割可用于简化对乳腺癌的分析和对角化! 就是这样的尝试。 网络 U-Net是用于生物医学图像分割的最新CNN架构。 该体系结构包括捕获上下文的收缩路径和实现精确定位的对称扩展路径。 这是一个完全卷积网络(FCN),因此可以处理任意大小的图像! 除了已经使用了作者使用的“相同”填充而不是“有效”之外,我已经实现了与原始U-Net架构相似的架构。 始终使用“相同”填充使输出分割蒙版与输入的分割蒙版(高度,宽度)相同。 数据集 来自数据集
2021-10-19 17:47:40 5.73MB 系统开源
1