DSCI 553:数据挖掘的基础和应用
作业概述
这项任务的目的是使您熟悉A-Prior,MinHash,本地敏感哈希(LSH)和不同类型的推荐系统。
数据
数据集主页: :
您可以使用小型数据集进行开发。 包括数据集的副本,以及拆分的训练和测试数据。
任务任务1:查找有趣的关联规则
用户对电影的评分存储在rating.csv中。 回顾基于市场的模型。 用户给予5.0评级的电影集可以视为购物篮。
任务:在这些购物篮中找到关联规则{1,2,⋯,}→,使得interest≥和support≥S .并且是movieId 。
笔记:
在此任务中仅考虑5.0评级。
您应该使用像A-Prior方法这样的高效算法。
尽管兴趣可能是正面的或负面的,但这里只考虑正面的兴趣
为了简化计算,将支持阈值应用于。 在教科书中,仅支持该支持。 j必须是单个元素。
等级:
总共20分
这是确定性
2025-06-02 20:47:36
11KB
Python
1