已获国家三等奖 1.构建mRMR-置换特征重要性混合模型 2.构建化合物分子的生物活性定量预测模型 3.构建ADMET分类预测模型 4.使用的改进遗传算法
kMeans_PCA 在sklearn乳腺癌数据集上包含k-Means和PCA的原始代码
2021-12-21 14:00:30 97KB JupyterNotebook
1
与所有其他癌症相比,乳腺癌是女性发生的第二大癌症。 2004 年记录了大约 110 万例病例。观察到这种癌症的发病率随着工业化和城市化以及早期检测设施的增加而增加。 它在高收入国家仍然更为常见,但现在在包括非洲、亚洲大部分地区和拉丁美洲在内的中等和低收入国家Swift增加。 在所有病例中,乳腺癌是致命的,并且是女性癌症死亡的主要原因,占全球所有癌症死亡人数的 16%。 本研究论文的目的是提出一份关于乳腺癌的报告,我们利用这些可用的技术进步来开发乳腺癌存活率的预测模型。 我们使用了三种流行的数据挖掘算法(朴素贝叶斯、RBF 网络、J48)来开发使用大型数据集(683 例乳腺癌病例)的预测模型。我们还使用了 10 倍交叉验证方法来测量无偏估计用于性能比较目的的三个预测模型。 结果(基于平均准确度乳腺癌数据集)表明,朴素贝叶斯是最好的预测器,对保持样本的准确度为 97.36%(该预测准确度比文献中报道的任何预测准确度都要好),RBF 网络出来了第二个以 96.77% 的准确率,J48 以 93.41% 的准确率排在第三位。
2021-12-19 13:23:16 394KB Breast cancer data
1
作为全球女性中最常见的癌症之一,乳腺癌引起了研究人员的最多关注。 经证实,准确及早发现乳腺癌可以增加患者采取正确治疗方案并长期生存的机会。 本文旨在探讨可用于从常规血液分析数据预测乳腺癌的生物标志物的范围。 支持向量机(SVM)已经为癌症分类领域做出了重要贡献。 然而,不同的核函数配置及其参数会显着影响 SVM 分类器的性能。 为了提高 SVM 分类器对乳腺癌诊断的分类精度,本文提出了一种新的癌症分类算法,该算法基于使用网格搜索算法的智能算法优化 SVM 分类器的相关参数这些参数是: 高斯径向基函数 (GRBF) 核SVM分类器的参数g和C惩罚参数。 我们的实验表明,使用网格搜索的 SVM 参数优化总是在给定范围内找到接近最佳的参数组合,以评估所提出模型的性能,使用取自 UCI 库的乳腺癌科英布拉数据集。 在这个数据集时代,使用了体重指数 (BMI)、葡萄糖、胰岛素、稳态模型评估 (HOMA)、瘦素、脂联素、抵抗素和趋化因子单核细胞趋化蛋白 1 (MCP1) 属性。 在该数据集上将所提出方法的性能与其他方法的性能进行比较。 获得的结果显示了对最先进算法的改进,具有改进的性能参数,例如疾病预测准确性、灵敏度和更好的 F1 分数等。 资金声明:作者表示,这项研究没有获得外部资金。利益声明:作者声明没有利益冲突。道德批准声明:不需要。
2021-12-15 15:39:06 1.17MB breast cancer; machine learning;
1
RIDER Breast 是乳腺癌 MRI 影像数据,旨在对各种类型的癌症诊治过程进行全程数字化的跟踪,以数字档案的形式记录检查结果、处方和疗效。
2021-12-12 11:24:24 96.27MB CT影像 医疗数据 智慧医疗 机器视觉
1
Breast_Cancer_Classification 利用逻辑回归和神经网络模型基于数字化活检图像将乳腺癌肿瘤分类为恶性或良性
2021-12-05 15:49:54 582KB HTML
1
乳腺癌主要是在女性中发现的,并且是增加女性死亡率的一个主要原因。 乳腺癌的诊断非常耗时,并且由于系统的可用性较低,因此有必要开发一种可以在早期阶段自动诊断乳腺癌的系统。 各种机器学习和深度学习算法已被用于良性和恶性肿瘤的分类。 已使用威斯康星乳腺癌数据集,其中包含 569 个样本和 30 个特征。 本文重点介绍了在从存储库中提取的数据集上实现的各种模型,例如逻辑回归、支持向量机 (SVM) 和 K 最近邻 (KNN)、多层感知器分类器、人工神经网络 (ANN) 等Kaggle 的。 这些算法中的每一个都已经过测量,并就获得的准确度和精确度进行了比较。 所有技术都用 Python 编码并在 Google Colab 中执行,这是一个科学的 Python 开发环境。 实验表明,SVM 和随机森林分类器最适合预测分析,准确率为 96.5%。 为了提高预测的准确性,已经实施了 CNN 和 ANN 等深度学习算法。 在 ANN 和 CNN 的情况下获得的最大准确率分别为 99.3% 和 97.3%。 Relu 和 sigmoid 等激活函数已被用于根据概率预测结果。
2021-12-05 14:57:48 290KB 论文研究
1
决策树 对新患者进行分类的乳腺癌数据集的决策树。 训练数据 该模型是使用699例乳腺癌患者的数据集构建的。 数据集经过归一化和清洗,最终使500名患者接受了培训和测试的最终数据集。 共有500例患者,其中262例(52.4%)患有良性肿瘤,238例(47.6%)患有恶性肿瘤。 为了进行训练,使用了80%的数据,其中40%是良性肿瘤,40%是恶性肿瘤,其余20%用于测试。 在这20%中,12.4%来自良性肿瘤,而7.6%来自恶性肿瘤。 怎么跑 克隆存储库 启动你的服务器 现在,您可以从“决策树”中访问预测结果。 要查看命中率,请inspecionar并检查console 。 注释 src目录中的decision-tree.js文件已从以下存储库中删除,该存储库允许使用和修改: :
1