该工具使用随机森林和PAM对观察进行聚类并计算观察之间的差异。 它支持对新观测值的在线预测(无需重新训练); 并支持同时包含连续(例如CPU负载)和分类(例如VM实例类型)功能的数据集。 特别是,我们使用随机森林算法的无监督公式来计算相似度,并将其作为聚类算法的输入。 为了提高效率并满足自主云的动态需求,我们的方法包括两个步骤:(i)离线聚类和(ii)在线预测。 RF + PAM可以:聚类观察(无监督学习)计算2个或更多观察之间的差异(两个观察的差异如何)
2021-08-27 20:16:58
30KB
开源软件
1