28 部电影-超 70 万 用户-超 200 万条 评分评论 想看数据建议用notepad++打开 用于分析类型 推荐系统 情感/观点/评论 倾向性分析 豆瓣电影
1
Book – Crossing Dataset 是由 Book – Crossing 社区的 278858 名用户的评分组成,其包含约 271379 本书的 1149780 条评分数据,该数据集包含 3 个分类。 BX-用户 包含用户信息,其中用户 ID 已被匿名化并映射到整数,除了包含人口统计数据的部分,其余字段均包含 NULL 值。 BX-书籍 包含书本的 ISBN 标识,除此之外,还提供了作者、出版年份、出版社等基于内容的信息,在拥有多位作者的情况下,仅提供第一作者;并且该数据集提供了链接到封面图像的 URL,相关链接直接指向 Amazon 网站。 BX-书本评级 包含图书评分信息,其中评级分为明确、从 1 – 10 表示和用 0 表示的隐含值。 该数据集由德国自由堡大学于 2005 年发布,相关论文有《Improving Recommendation Lists Through Topic Diversification》。
2022-07-13 11:04:49 50.61MB 数据集
There are ten data sets. Each of the data sets was generated from a single prompt. Selected respones have an average length of 50 words per response. Some of the essays are dependent upon source information and others are not. All responses were written by students primarily in Grade 10. All responses were hand graded and were double-scored. 这有十个数据集。每个数据集都是从单个提示符生成的。选定的回答平均长度为50字。一些论文是依赖于来源信息和其他不是。所有的回答都是由10年级的学生写的。所有的回答都是手工评分的,并且是双重评分。 bag_of_words_benchmark.csv length_benchmark.csv public_leaderboard_solution.csv test.csv Guidelines for Transcribing Student Essays.pdf The Hewlett Foundation Short Answer Scoring_datasets.txt
2022-04-27 22:17:39 189KB 数据集
1
movielens数据集(包含全部数据:10万、100万、1000万条评分数据)
1
用户对电影的评分-数据集
2022-02-02 16:13:43 817KB 数据集
1
本文主要介绍基于项目的协同过滤推荐算法的推荐原理、推荐过程、代码实现。 一、基于项目的协同过滤推荐算法推荐原理 基于项目的协同过滤推荐算法也是推荐算法中最基础、最简单、很重要的算法,主要是根据用户对项目的某一种操作行为,构成项目-用户操作行为矩阵,根据操作行为矩阵计算项目之间的相似度,最终为目标用户推荐目标用户有操作行为的预测评分高的项目,作为目标用户感兴趣的项目。 二、基于项目的协同过滤推荐算法推荐过程 基于项目的协同过滤推荐算法推荐过程可分为三个步骤:构建项目-用户操作行为矩阵、计算项目之间似度、获取推荐结果。 1、构建项目-用户操作行为矩阵 我们以用户对项目的评分数据为例,M个项目和N个
2021-11-03 11:04:07 48KB ie le lens
1
本文主要介绍基于用户的协同过滤推荐算法的推荐原理、推荐过程、代码实现。 一、基于用户的协同过滤推荐算法推荐原理 基于用户的协同过滤推荐算法是协同过滤推荐算法中最简单、最传统的推荐算法,是根据用户对项目的某一种操作行为,为目标用户找到操作行为相同或者相似的用户,这些操作行为相同或者相似的用户称之为目标用户的近邻用户,然后在这些近邻用户中找出目标用户没有操作行为同时近邻用户同时有操作行为的项目,最后将这些项目推荐给目标用户,作为目标用户感兴趣的项目。 二、基于用户的协同过滤推荐算法推荐过程 基于用户的协同过滤推荐算法推荐过程可分为四个步骤:构建用户-项目操作行为矩阵、计算用户之间似度、得到目标用户
2021-06-25 02:43:43 50KB ie le lens
1
本文件为kaggle中的信用评分数据,如不方便在kaggle上下载的,可在这里下载。【kaggle链接https://www.kaggle.com/mlg-ulb/creditcardfraud】———数据为脱敏后的信用卡欺诈数据,特征通过PCA转换之后失去了实际的特征意义。
2021-05-09 22:05:45 65.95MB 信用卡 信用卡欺诈 机器学习 数据集
1
此内容包括:用户画像数据:user_profile.data,物品(音乐)元数据:music_meta,用户行为数据:user_watch_pref.sml。可以使用此数据做一个推荐系统的demo
2021-04-12 16:41:01 34.96MB 推荐系统实践
1
数据共100多万条,以下是数据的格式,产品编号,产品ID,评分,用户ID,谢谢!
2021-03-19 17:20:19 165.28MB 京东数据集 京东评分数据
1