机器学习是量化金融中一个越来越重要和有争议的话题。 关于机器学习技术是否可以成为实用的投资工具,一直存在激烈的争论。 尽管机器学习算法可以发现微妙的、上下文的和非线性的关系,但在尝试从嘈杂的历史数据中提取信号时,过度拟合会带来重大挑战。 在本文中,我们描述了一些围绕机器学习的基本概念,并提供了一个简单的例子,说明投资者如何使用机器学习技术来预测股票收益的横截面,同时限制过度拟合的风险。
2022-11-20 06:59:23 1.41MB Machine Learning Return
1
内容摘要: 在该资源文件夹当中包括了数据预处理和特征工程后的数据(数据来源于第五届泰迪杯技能赛,数据经过作者预处理和特征工程),以及一步导出随机森林训练结果的模型评估函数,模型的特征重要性图像、模型评估的混淆矩阵。同时资源中还有数据不平衡得处理操作,实现方式为下采样。在资源当中还实现了,利用遗传算法(GA)对随机森林进行n_estimators、max_depth、min_samples_split、min_samples_leaf、max_features的参数优化。 资源结构: -BinaryClassification(GA) --data:数据 --image:导出图片 --model:模型参数 --Binary_RF(GA).py:遗传算法优化 --BinaryRF.py:常规随机森林分类 适合人群: 该资源适合用来竞赛和写论文,可以快速导出结果,大大节省时间。 使用建议: 二分类数据预处理和特征工程处理好后,导入数据分配好特征和标签,然后运行就可以导出模型的训练权重和模型的特征重要性图像、模型评估的混淆矩阵图像。遗传算法调参属于进阶内容,不懂得可以私信作者。
1
分类算法(决策树、支持向量机)建立决策函数,然后判断如下数据的类别。 (青年,是,否,非常好)请按列表写结果并附加程序和运行结果。
2022-11-19 14:25:11 3KB 机器学习 决策树 svm 支持向量机
1
练习使用 Python 语言,请对“西瓜数据集2.0"中的数据进行分析,使用朴素贝叶斯方法学习西瓜数据后验条件概率分布,并对如下瓜的类型做出判断(乌黑,蜷缩,浊响,稍糊,平坦,硬滑)将 Python 运行结论截图上传到本题
1
石家庄20160701-20170701.csv
2022-11-19 14:25:05 16KB 机器学习 python
1
机器学习公式推导以及解析
2022-11-18 19:28:53 572KB 机器学习
1
深度学习里一宏PPT的参考
2022-11-18 19:28:52 248.19MB 机器学习
1
机器学习西瓜书的公式解析
2022-11-18 19:28:51 884KB 西瓜数
1
随机森林图像matlab代码指静脉生物特征识别 使用机器学习的手指静脉生物识别 使用机器学习算法分析人的手指静脉数据的MATLAB应用程序。 手指静脉生物识别技术是最先进的身份验证系统之一,它解决了现有身份验证系统的许多问题。 支持向量机(具有线性,RBF,MLP,二次和多项式内核),随机森林,决策树,线性和逻辑回归,K均值,DB扫描,最近邻居,K最近邻居是用于训练的一些算法并测试数据集。 使用过的CCD扫描图像数据。 这些图像经过预处理,过滤并使用所得数据。 2D绘图显示了分类结果和精度。 源代码具有静态文件路径,如果处理不当,可能会出错。
2022-11-18 18:22:05 197KB 系统开源
1
Feature Engineering for Machine Learning_Principles and Techniques for Data Scientists(2018.03).A4
2022-11-18 14:57:30 6.16MB 机器学习 特种工程
1