上传者: 47367099
|
上传时间: 2022-06-19 09:09:31
|
文件大小: 587KB
|
文件类型: ZIP
Spark 推荐系统
技术栈
数据处理
Spark Core + Spark SQL + MongoDB
离线推荐
静态数据处理:Spark Core + Spark SQL
推荐服务:Spark Core + Spark MLlib
在线推荐
获取消息服务:Redis + Kafka
推荐服务:Spark Streaming
数据集格式
商品数据集(Product)
字段名 类型 描述 说明
_id 自动生成
productId int 商品 id
name String 商品名称
imageUrl String 商品图片
categories String 商品分类 由 | 分隔
评分数据集(Rating)
字段名 类型 描述 说明
_id 自动生成
userId int 用户 id
productId int 商品 id
score double 用户评分
timestamp int 评分时的时间戳
用户数据集(User)
字段名 类型 描述 说明
_id 自动生成
userId int 用户 id
username String 用户账号
pas