(4)数据预处理 在实际的建模过程中,我们能够得到的数据都会存在一定的问题,我们称之 为“脏数据”,例如会存在缺失值、数据量纲不统一、数据类型不一致等问题; 也可以通过原始数据衍生出新数据,进行特征工程。数据的质量一般会影响到最 后分类结果的准确性,因此,数据处理也是一个不能忽视的建模过程。 (5)分类模型构建和模型评估 以上四步从更本上来说主要是为建立分类模型这一步做准备工作,因此,挑 选出一种准确率高、稳定性好的分类模型是整个多因子选股策略的关键部分,传 统的多因子选股策略一般选择回归法,将各种因子与收益率结果进行回归分析, 拟合出一条能够分类的曲线。模型的评估主要是通过历史回测,看所建立的模型 的收益情况来判断模型的效果好坏。 隧圈⋯。_圈量~》霍峥隧雹》鏖圈 3.3多因子选股模型构建步骤图 以上多因子选股模型的构建步骤是常规传统多因子选股模型的最常用步骤, 所有研究者开发出的多因子选股模型的区别体现在两个方面,一个是选择不同的 因子或因子数量,另一个是选择更为有效的分类算法,得出更准确的结果。在因 子选择上,各研究者的多因子模型大同小异主要包含基本面五大类财务指标,技 术面指标如动量、换手率、波动率等和其他指标如预期收益增长、宏观经济变量 等。而在综合多因子得出最后的判断上,从最初的综合打分法和线性回归到运用 机器学习算法如决策树、SVM到提升算法如随机森林、GBDT,研究者们一直尝 试运用更新更有效率的模型来得出更准确的结果。 基于以上分析,本文也尝试从因子选取和算法选择两个方面来改进学术和市 万方数据
2021-11-06 10:51:15 7.58MB 量化投
1
量化交易多因子模型。A five-factor model directed at capturing the size, value, profitability, and investment patterns in average stock returns performs better than the three-factor model of Fama and French (FF, 1993). The five-factor model's main problem is its failure to capture the low average returns on small stocks whose returns behave like those of firms that invest a lot despite low profitability. The model's performance is not sensitive to the way its factors are defined. With the addition of profitability and investment factors, the value factor of the FF three-factor model becomes redundant for describing average returns in the sample we examine.
2021-11-05 23:17:21 476KB 量化交易 quantative trading 多因子
1
101 Formulaic Alphas - Zura Kakushadze 基于短周期价量特征的多因子选股体系--数量化专题之九十三--国泰君安
2021-11-04 15:21:06 16KB python
1
使用财务数据构建一个多因子选股模型,在支持向量机分类上进行预测优化。选股上使用排序法对数据进行预处理,再使用支持向量机对股票收益进行分类预测,最后使用数据到分离超平面的距离进行排序,优化支持向量机的分类预测。实证中,从中证500成分股中选出股票组合,在2016年四季度到2018年一季度获得累计收益88.96%。择时策略的均线策略和通道突破策略均能有效降低波动率和回撤。还使用高频数据来降低均线策略的滞后性,波动率又得到进一步降低。本模型利用支持向量机性质提高预测精度,结合技术分析优化了策略的收益,为多因子选股和交易提供了新的研究视角。
2021-10-22 12:37:37 665KB 支持向量机
1
基于机器学习的多因子寻物app.pdf
2021-09-25 17:02:06 1.24MB 机器学习 参考文献 专业指导
多因子选股模型之因子分析与筛选Ⅰ:估值与财务成长类指标
2021-09-18 17:11:33 1.67MB 多因子 选股模型 因子
1
可作为了解,主要对多因子方差和正交实验做了解释
2021-09-11 19:36:55 29KB 正交试验设计原理.
1
20190214-财通证券-“星火”多因子专题报告(三):Barra模型深化:纯因子组合构建.pdf
2021-09-10 11:12:44 2.25MB FinE
1
多因子分域研究系列(十):三因子模型下的残差动量因子分域探究之沪深300指数篇
2021-09-07 09:03:03 1.33MB
多因子分域研究系列(九):三因子模型下的残差动量因子分域探究之上证50指数篇
2021-09-07 09:03:00 1015KB