EDA和ML项目
存储库包含各种项目,这些项目都使用R语言编写了以下代码:
探索性数据分析
机器学习模型(线性回归,逻辑回归,k均值聚类,分层聚类,SVM,决策树,随机森林,时间序列分析,XGBoost)
以下是一些常用的程序包/库的列表,这些程序包/库被用作数据分析和构建机器学习模型的一部分
数据处理: dplyr,plyr,tidyr,stringer,data.table,lubridate(用于日期处理),
数据可视化: ggplot2,cowplot,ggthemes,比例
ML模型: randomForest,caret(用于数据拆分,交叉验证,预处理,特征选择,变量重要性估计等)
推荐模型: re荐
文本挖掘: tm,tidyverse
1