14.4 基于协同过滤的推荐系统
典型的推荐应用
—公司积累了大量的用户(user)对物品(item)的打分记录。
—根据当前用户的消费喜好,找到与其喜好相似的其他客户,分析他们有哪些物品(item)
对当前用户而言尚未消费使用,将这些物品推荐给当前用户。
—前提:当前访问用户的消费喜好和其他某些用户的消费喜好相似,且这种喜好在 近一段
时间以及未来一段时间内保持稳定。
—这样的推荐系统称为基于协同过滤的推荐系统(Collaborative-based Systems)
基于协同过滤的推荐系统又可分为:
—基于用户(user)相似度(临近度)推荐(计算两个用户间的相似度,共同喜好总物品数)
—基于物品(item)相似度(临近度)推荐(计算两个物品间的相似度,共同拥有的用户数)
操作步骤
第一步:加载并查看数据
将训练数据“collaborative_train”拖动到操作流程页面,将其连接到系统输出端,点击
运行后,我们看到数据分成三列,分别是“user_id”用户属性,“item_id”物品属性以及“rating”
打分属性,如图 14.1,有 28234 条打分记录,通过观察统计视图,没有发现缺失值。将测试
数据“collaborative_test”同样拖到流程里面来,观察数据,也有同样的属性项。
图 14.1 用户对物品的打分表
1