MovieLens 100K上的概率矩阵分解
总览
在此项目中,我们使用MovieLens 100K数据集。 该数据集包含来自943位用户的1,682部电影的100,000个评分。 在此项目中,RMSE(均方根误差)用作度量。
我测试了2种不同的数据分割:密集和稀疏。
数据是随机拆分的,用于训练/验证的数据为80%,对于密集数据的测试为20%,对于稀疏数据,仅训练/验证的数据为20%,对于测试为20%。 在训练中,应用5倍交叉验证来选择最佳超参数并在测试集中评估模型。
运行代码
参量
任务:[“ task1”-调整正则化参数,“ task2”-调整因子数量,“ predict”-预测等级]
1