MovieLens 100K上的概率矩阵分解 总览 在此项目中,我们使用MovieLens 100K数据集。 该数据集包含来自943位用户的1,682部电影的100,000个评分。 在此项目中,RMSE(均方根误差)用作度量。 我测试了2种不同的数据分割:密集和稀疏。 数据是随机拆分的,用于训练/验证的数据为80%,对于密集数据的测试为20%,对于稀疏数据,仅训练/验证的数据为20%,对于测试为20%。 在训练中,应用5倍交叉验证来选择最佳超参数并在测试集中评估模型。 运行代码 参量 任务:[“ task1”-调整正则化参数,“ task2”-调整因子数量,“ predict”-预测等级]
2021-04-02 13:43:10 328KB scikit-learn sklearn matrix-factorization sparse
1
基于MovieLens数据集,采用随机梯度下降算法优化最小化能量函数的概率矩阵分解Python源代码,自己做实验的源代码Probabilistic Matrix Factorization
2019-12-21 21:19:24 749KB 概率矩阵分解
1
概率矩阵分解(PMF)在数据集Movielens 100K上的实验。
2019-12-21 19:57:38 746KB 概率矩阵分解
1