总内容500多M 是做推荐算法的不二之选,一定需要的数据集
2022-05-24 17:09:24 534.94MB 推荐算法 算法 机器学习 人工智能
1
DFT的matlab源代码MovieLens数据集分析 马修·约翰逊(Matthew Johnson) 数据集包含4个与电影分级有关的csv文件。 我想探索: 哪些类型与评级趋势或分布最相关? 用户评分习惯(高/低方差,高/低趋势)。 与正面评分与负面评分相关的标签。 预算/工期与评分是否有任何关系? DataFrame形状:电影:(9125,3),评分:(100004,4),标签:(1296,3),链接:(9125,3) % matplotlib inline import numpy as np import matplotlib . pyplot as plt import pandas as pd import seaborn as sns movies = pd . read_csv ( 'movies.csv' ) ratings = pd . read_csv ( 'ratings.csv' ) tags = pd . read_csv ( 'tags.csv' ) movies_2 = pd . read_csv ( 'movies_exploded.csv' ) im
2022-05-20 10:56:23 2.43MB 系统开源
1
MovieLens 10M数据集,存储了用户对电影的评分信息,可用于推荐系统研究。
2022-05-19 17:11:39 955KB movielens
1
MovieLens 25M movie ratings. Stable benchmark dataset. 25 million ratings and one million tag applications applied to 62,000 movies by 162,000 users. Includes tag genome data with 15 million relevance scores across 1,129 tags. Released 12/2019
2022-05-17 12:06:09 253.71MB ctr
1
电影_推荐系统 该项目存储库基于构建电影推荐系统克隆 数据集详细信息: 提及用于构建此推荐引擎的数据集如下: 使用的数据集: MovieLens数据集 下载数据集:从以下链接下载数据集 下载Kaggle上托管的MovieLens数据集,然后使用 从其官方网站下载MovieLens数据集,然后使用 数据集文件格式: CSV文件(以逗号分隔的值)。 注意:将数据集下载并保存在input_data文件夹中 数据集类型: 完整的数据集:该数据集包含26,000,000个评分和270,000个用户将750,000个标签应用程序应用于45,000部电影。 包括在1,100个标签中具有1200万相关分数的标签基因组数据。 注意:我们将使用完整数据集为电影建立一个简单的建议。 小型数据集:该数据集包含100,000个评分和1,700个标签应用程序,这些应用程序由700位用户应用于9,000部电影。
1
根据用户历史观影评分数据预测出观众喜欢的电影,并予以推荐。
2022-05-06 20:08:46 4.81MB 电影推荐系统lstm协同过滤
TCC 使用movielens 100k数据集的推荐系统( )
1
MovieLens推荐模型。 MovieLens是一个2,000万收视率的数据集,涉及138 000多名用户的27 000部电影,更多信息请。 最先进的模型使用: RMSE为0.80的 RMSE为0.81的自动。 从出发,我们使用针对分类变量的实体嵌入来构建深度学习模型,该模型可实现与最新模型相当的RMSE为0.81 。 神经网络是在具有TensorFlow后端的Keras中实现的。 该代码在“ movienet.py”文件中,而培训在培训笔记本中。 实体嵌入的一大优点是,在训练过程中,我们可以计算电影和用户的嵌入空间。 因此,我们有不同的方法将电影推荐给用户: 我们评估网络并推荐收视率最高的电影。 但是,RMSE为0.81时,每个预测的平均误差为0.8星。 对于电影,我们查看嵌入空间中最近的邻居。 在这种情况下,我们使用带有的KNN索引。 有了足够的尺寸,我们希望这些嵌入能
2022-04-24 14:08:29 25KB JupyterNotebook
1
movielens数据集(包含全部数据:10万、100万、1000万条评分数据)
1
推荐
2022-04-06 03:13:39 15KB 推荐系统
1