社交借贷(也称为对等借贷)为客户提供了一个在线借贷的平台。 与借款人和贷方的银行相比,它以其优越的货币优势而Swift受到欢迎。 因此,选择一个可靠的设备非常重要,而大多数平台现在使用的唯一方法是分级系统。 为了更好地防范风险,我们提出了一种将随机森林和神经网络相结合的方法来预测借款人的状况。 我们的数据来自受欢迎的社交贷款平台Lending Club,我们的结果表明我们的方法优于Lending Club的良好借款人等级。
1
当前,机器学习技术已广泛应用于工业、农业、交通、环境等各个领域。特别在农 业生产领域,由于农业信息化和精准农业的推广和实施,农业生产数据不断迅速增长并 大量积累,这大大增加了对信息技术的需求,尤其对机器学习技术的需求更加显著。然 而,由于农业生产问题的复杂性,对决策问题直接采用传统的机器学习方法往往达不到 理想的效果,因此如何构造最优的基于机器学习的农业智能决策方法是当前亟待解决的 问题。 本文重点研究利用群智能优化技术对现有若干机器学习技术进行改进,构建基于机 器学习技术的农业智能决策新方法,进而将这些新方法用于解决实际农业生产问题。我 们首先对随机森林、多目标聚类、支持向量机和核极限学习机等方法在计算精度、适用性 和稳定性方面存在的问题进行了探讨,提出了三维混沌果蝇优化技术、改进粒子群优化 技术、改进灰狼优化技术和多种群灰狼优化技术,然后分别对上述机器学习方法进行改 进,进而提出三维混沌果蝇优化的随机森林预测模型、改进粒子群的动态多目标优化诊 断模型、改进灰狼优化的支持向量机诊断模型、多种群灰狼智能演化核极限学习机预测 模型,分别用于水稻的虫害预测、病害诊断、缺素诊断和产量预测..
2022-04-27 16:05:44 7.48MB 机器学习 文档资料 人工智能
网络的出现及广泛应用,给人们的生活和工作带来了便捷,但同时也带来了 很多安全问题,各种类型的病毒、漏洞、攻击都造成了巨大的损失。如何保护信 息不被攻击和泄露,维护其完整性、可用性和保密性,是当前研究的关注重点。 面对网络安全的现状,目前主要采取访问控制、数据加密、身份认证、防火墙、 和入侵检测技术等措施,保障网络和信息系统的安全。入侵检测技术通过收集操 作系统、系统程序、应用程序、以及网络流量包等信息,发现被监控系统或网络 中违背安全策略,或危及系统安全的行为,是保障系统和网络安全的有效手段。 机器学习方法用计算机模拟人类的学习活动,研究如何通过计算机学习现有 的知识,发现新的知识,并通过不断完善,提升学习的效果。机器学习中包含大 量的数据预处理和分类方法,与统计学、人工智能、信息论等学科有关联。其基 本过程是通过从已有的经验中学习并构建学习机,进一步对未知的数据进行分类 或预测。 本文将机器学习的部分典型方法和算法应用于入侵检测中,探索其中的相关 数据处理方法在入侵检测中应用的有效性和可行性。本文的研究在一个基于机器 学习的入侵检测系统(Intrusion Detection Sys
2022-04-27 16:05:39 3.1MB 机器学习 文档资料 人工智能
机器学习方法集成到实验数据加速科学发现的处理过程.docx
SVMImageClassification:基于SVM的简单机器学习分类,可以使用svm, knn, 朴素贝叶斯,决策树四种机器学习方法进行分类
2022-03-27 14:22:29 29.28MB 附件源码 文章源码
1
我们描述了如何在理论开发中使用机器学习 (ML) 方法。 与传统的因果推理方法相比,ML 方法对最能代表数据的底层模型的函数形式做出的先验假设要少得多。 鉴于此,研究人员可以使用此类方法来探索数据中可能导致归纳理论构建的新颖而稳健的模式。 ML 的优势包括对数据中新模式的可复制识别。 此外,ML 方法解决了学者提出的与战略和管理领域的实证研究规范相关的几个问题(例如“p-hacking”和混淆局部影响对全局影响)。 我们制定了一个分步路线图,说明如何使用四种 ML 方法(决策树、随机森林、K-最近邻和神经网络)来揭示可用于理论构建的数据模式。 我们还说明了相对于传统方法,ML 方法如何更好地阐明交互和非线性效应。 总之,ML 方法可以作为现有归纳理论创建方法(例如多案例归纳研究)和传统因果推理方法的补充工具。
2022-03-17 22:41:16 1.13MB Machine Learning Theory
1
机器学习方法在股指期货预测中的应_省略_SVM和XGBoost的比较分析_黄卿.pdf
2022-03-11 14:20:17 1.52MB FinE
1
statistical-machine-learning-lab 统计机器学习方法练习
2022-03-03 01:44:02 272KB HTML
1
从音频数据对歌曲流派进行项目分类 使用由两种音乐流派(嘻哈和摇滚)的歌曲组成的数据集,我们将训练一个分类器,仅基于从Echonest(现在是Spotify的一部分)获得的曲目信息来区分两种流派。 我们将首先使用Python中的熊猫和seaborn软件包对数据进行子集,汇总信息以及在探查数据时发现明显的趋势或进行机器学习时应注意的因素时创建图。 接下来,我们将使用scikit-learn程序包来预测我们是否可以根据诸如舞蹈性,能量,声学,节奏等特征正确地对歌曲的类型进行分类。我们将介绍PCA,逻辑回归,决策树等等。
2022-03-02 08:49:32 1.46MB JupyterNotebook
1
生存分析中机器学习方法的仿真研究 在Weibull分布下或具有复杂基线风险(转折点)的情况下模拟生存时间,其中协变量对风险的线性或线性和非线性影响以及审查水平的变化。 将模拟数据集分为训练和测试数据集。 适合随机森林; 支持向量机将带有弹性网罚的Cox模型和受罚样条曲线(弹性参数)模型应用于训练数据集。 记录各种方法所需的时间。 使用训练数据集中的拟合模型预测测试数据集中的风险评分。 计算一致性指数,将测试数据集中的预测风险分数与观察到的审查状态和生存时间进行比较。
2022-02-12 15:43:45 584KB R
1