上传者: 42143161
|
上传时间: 2022-03-10 06:53:49
|
文件大小: 675KB
|
文件类型: -
machine_learning
此仓库包含四个机器学习项目。
项目1
在这个项目中,我们根据大脑图像数据预测一个人的年龄。 在对数据执行了一些预处理(例如特征选择,缩放和消除多重共线性)之后,我们使用了一种堆栈技术来组合不同基础模型的输出,包括每个模型的各种实例以及不同的参数。
项目二
在此任务中,我们基于图像特征进行了疾病分类。 这项任务面临的挑战是如何应对训练数据中的高级失衡。 我们尝试了欠采样和过采样技术,但最终发现欠采样的结果更好。 对于过采样,我们尝试了合成少数过采样技术,对于欠采样,我们尝试了一些方法,包括随机欠采样,浓缩最近邻规则欠采样,近遗漏欠采样,tomek链接和单面选择,但是我们发现在以下方面效果最好的方法数据集是邻居清洁规则。 我们使用支持向量机作为最终模型。
专案3
在此任务中,我们将ECG信号分类为健康和不健康的心跳。 我们的模型是Catboost分类器。