机器学习大作业-机器学习分类,回归,聚类算法项目源码 第一次作业 LinearDiscriminatorAnalysis分类,逻辑回归2,3分类 第二次作业 决策树 第三次作业 MLPClassifier分类器,Percepton线性分类器 第四次作业 一维拟合,二维拟合,支持向量机分类 第五次作业 多项式朴素贝叶斯分类器 第六次作业 GMM聚类算法 第七次作业 AdaBoostClassifier分类器 第八次作业 KMeans,KMedoids聚类
癌症是导致人类死亡的众所周知的疾病,乳腺癌(BC)是女性诊断出的癌症之一。 一生中大约有八名女性被诊断出患有BC。 如果尽早诊断出BC,可以很容易地进行治疗。 这项研究的方法是通过不同的机器学习(ML)技术来识别患有BC或不患有BC的患者。 在这项研究中,威斯康星州诊断性乳腺癌(WDBC)数据集将通过支持向量机(SVM),k最近邻(k-NN),朴素贝叶斯(NB),决策树(DT)和逻辑回归(LR)进行分类)。 分类之前有一个预处理阶段,其中五个不同的分类器应用了5倍交叉验证方法。 分类性能是通过使用混淆量度通过性能测量参数(即准确性,敏感性和特异性)来测量的。 在这项研究中,SVM在归一化过程后发现的最佳性能为99.12%的精度。
2022-05-21 16:38:44 544KB Breast Cancer WDBC SVM
1
入围不当的候选者和可能错过的候选者只是意味着与不正确的关键字相关联的不当简历。 这些天来,由于对文本分类的兴趣日益浓厚,对文件分类的研究越来越多,而文本分类已成为在线文本和文档的主要贡献者。 机器可以使用专家系统来处理人员对细节进行分类的重复任务,该专家系统可以正确捕获和识别文本,然后将其分类为已定义的不同类别。 在对数据进行预处理之后,对贝努利的朴素贝叶斯,多项朴素贝叶斯,随机森林,线性SVM和LSVM进行了比较分析,并在前30个具有不同参数的Job Listing数据集上进行了弹性惩罚分类,因此我们能够分析具有不同密度和科目的类中不同术语之间的依赖关系。 评估了准确性,并且LSVM根据提交的查询在对职称进行分类时提供了最佳准确性,并且能够对55000个样本实现96.25%的准确性。
2022-05-21 01:31:54 590KB TF-IDF LSVM BNB MNB
1
机器学习入门:手写数字识别,声呐分类,垃圾短信识别,鸢尾花分类 机器学习入门:手写数字识别,声呐分类,垃圾短信识别,鸢尾花分类 本系列代码是大多数初学者刚刚接触机器学习时会运行的代码,这些代码结构简单,原理清晰,易于实现。 项目均由jupyter notebook编写,适合分步骤运行,帮助理解每一步的功能。
2022-05-09 11:04:30 622KB 机器学习 分类 人工智能 数据挖掘
机器学习KNN分类,葡萄酒分类
2022-05-05 14:04:58 595KB 机器学习 分类 人工智能 数据挖掘
1
随 着 大数据 时 代 的 快速发 展 , 文 本 信 息 数据 量 急 剧 增 加 , 为 了 获 取有 价值 的 信 息 , 提升 信 息 获取 效 率 , 就 需 对这些文本信 息进 行分类 。 因 此 , 文 本分类系 统 的 研 究 与 实 现具 有 重要 意 义 。 新 闻 文本 是 文本信 息 的一个重 要组成部分 , 也 是人 们 获取 信 息 的重要 方式 。 本 文 以 新 闻 文本 分类为依 托 , 对 当 下 文本分类算法进 行 改进 , 以 新 闻 文本分类系 统 为 实例 对文 本 分类系 统 的 设计 与 实 现进 行 说 明 , 完 成 文 本 分类算法 的 研 究工 作 。 本文 以 大数据 时代背 景及 分类技术 的 发 展为背景 , 对 贝 叶斯 分类 算 法 以 及 卷积 神 经 网 络 分类 算 法进 行 了 改进 , 以 提升 分类 的 准确 度 , 主 要 工作 内 容 有 以 下 几个方面 : 第一, 本 文 针对 不 同 种 类 的 文本 分类方 法做 了 调 研 , 通过 阅 读 文
2022-04-28 09:09:16 7.18MB 机器学习 分类 人工智能 数据挖掘
实现西瓜数据集的二分类问题,其输出标记y={0,1},即给定数据集D={(xi,yi)},设法将样例投影到一条直线上,使得同类样本方差最小,异类样本个中心点尽可能的远。在对新样本进行分类时,将其投影到同样的这条直线线上,根据投影点的位置来确定样本的类别。
2022-04-28 09:09:14 231KB 机器学习 分类 文档资料 人工智能
1
本文在流量分场 景建模 的 基础上结合机器 学 习 算法对流量进行分类预测 研 究 , 同 时 搭 建 S DN 仿 真平 台 进行算法实现 , 具 有理论 与 实 践 意 义 。首 先 , 针对骨干 网 、 数据 中 心 、 边缘 网 及 大 突 发情况这 四 种 典 型的 流量场 景 结 合 前 人 的 研 究 工 作 分 别 建立 泊 松 、 MMP P 、 自 相 似 及P ar eto 数学模 型 , 深入研 究 流量特征 的 同 时 得 出 路 由 缓存 的 参考 大小 ,并进行现 网 流量分析与 SDN 网 络仿 真双 重验证 。其 次 , 在流量建模 的 基础上 , 使 用 l i ghtB GM 多 分 类算法对 泊 松 、MMPP 和 自 相 似流量数据进 行 分类 , 数据 预 处理提取特征 , 在 训 练 中对参数不 断优化 以 达到 较好 的 分类效果 ; 接 下 来 针对 己 分类 的 突 发性较 强 的 自 相 似流量进行数据处理 与 预测 研 宄 , 采 用 能够捕捉到 流量序列 中 长距离 依赖 的 L S TM 算法进行预测......
2022-04-27 20:07:08 9.83MB 算法 机器学习 分类 缓存
随着互联网技术的快速发展,互联网上的文本数据变得越来越多,传统的人工文本类 别划分方法已经无法应对当前的数据量,自动文本分类技术成为研究的热点。作为文本挖 掘技术的主要分支,文本分类技术可以有效解决大数据发展下的文本自动分类需求。特征 选择和文本分类算法是文本分类技术的两个关键部分,本文主要针对这两个部分进行研究。 在特征选择部分,本文提出一种基于卡方统计量(CHI)和互信息(MI)的混合特征 选择方法(CHMI),该方法首先针对卡方统计量方法对低频词敏感的缺点,引入词频因子 进行改进,然后使用调节参数改善互信息方法对类别敏感的不足,最终结合改进后的两种 方法,得到对低频词和类别均有较好处理效果的混合特征选择方法。实验结果表明,与传 统的卡方统计量方法和互信息方法相比,本文方法在支持向量机、朴素贝叶斯和K最近邻 分类器上,均可以有效提高文本分类的准确率。 在文本分类算法部分,分类器采用支持向量机,支持向量机的核心是核函数,本文提 出一种基于多项式核函数和高斯核函数的混合核函数。该核函数具有多项式核函数和高斯 核函数的优点,既具有多项式核函数能够提取整体特征的能力,又利用高斯核函数对局部
2022-04-27 20:07:01 2.93MB 机器学习 分类 人工智能 数据挖掘
摘要 现实中的很多实际问题都可以转化为数据信息处理中的数据分类问题,例如 气象预报、商品推荐、生物信息、网络检测等,而数据信息处理都是以机器学习 为基础进行研究的。随着科学技术的发展,机器学习算法的应用领域也变得十分 广泛。 本文主要介绍了两种机器学习算法:粒子群算法优化支持向量机和卷积神经 网络。其中研究了粒子群算法优化支持向量机在树叶分类和癌症基因分类中的预 测,卷积神经网络在图像分类中的应用。 (1)基于各种树叶的特征构建一个数据预处理模型:先对各种数据进行归一 化处理,采用主成分分析方法从16个特征中提取出3个主成分,再建立粒子群 算法优化后的支持向量机,用支持向量机对树叶数据进行分类预测。实验结果表 明,相对于遗传算法和网格搜索法寻到的最优参数相比,粒子群算法优化支持向 量机具有最高的准确率,高达94.1%,高于其他两种分类方法。 (2)将粒子群优化的支持向量机模型应用到癌症基因分类中,通过选取多组 不同的实验数据对癌症手术后病人的复发和不复发的基因样本进行预测分类。对 于三种不同分类方法对于癌症基因分类的不同分类效果,综合实验结果,粒子群 优化支持向量机在三种分类方法中达到
2022-04-27 16:05:46 6.31MB 算法 机器学习 分类 文档资料