小标签 使用 Spark、ML 和 solr 标记整个 8000 万个微型图像数据集并使其可搜索 完整数据集位于 位于CIFAR-100 子集
2021-06-10 20:03:43 165.97MB CSS
1
基于spark-ml,scala实现gbdt 算法,附带libsvm训练集和普通训练集实现,GBDT (Gradient Boosting Decision Tree) 梯度提升迭代决策树。GBDT 也是 Boosting 算法的一种,但是和 AdaBoost 算法不同(AdaBoost 算法上一篇文章已经介绍);区别如下:AdaBoost 算法是利用前一轮的弱学习器的误差来更新样本权重值,然后一轮一轮的迭代;GBDT 也是迭代,但是 GBDT 要求弱学习器必须是 CART 模型,而且 GBDT 在模型训练的时候,是要求模型预测的样本损失尽可能的小。
2021-06-10 19:29:04 40KB 机器学习 spark-ml GBDT 人工智能
1