项目主要内容: 1.采用Hadoop作为分布式文件文件系统存储数据 2.基于 TensorFlow 复现论文 PNN、DeepFM 3.搭建推荐系统架构,召回、过滤、精排阶段 4.使用 SparkStreaming 进行流计算,不断将用户行为反馈给模型进行计算,提供 下一次推荐服务 5.使用 SparkStreaming 对接 Kafka 源,消费 Kafka 中的实时用户行为数据 6.使用 PNN、DeepFM 进行 CTR 点击评估 目前,几大互联网厂商例如腾讯、百度、阿里已陆续开始使用推荐系统,因为在海量数据的今天,人们已经无法看清自己真正的喜好,所以推荐系统应运而生,像现在快手、抖音等平台都陆续开始引进推荐系统,这些厂商会收集大量用户的观看行为,例如点赞、评论、收藏以及视频观看时间等,基于这些数据会对用户进行分析,帮助用户进行定位自身的兴趣所在,然后基于大数据平台帮助用户拿到它们想要的视频,而且包括百度,它们正在使用广告推荐这种,当我们在搜索引擎中搜索一些关键词时,它们将会根据 query 进行分析进而将一些广告商进行关联,然后在首页为用户推荐一些广告进而增加广告的点击量。
2022-05-21 09:09:08 76.41MB hadoop spark 数据分析 推荐系统
成对-DeepFm python main.py
2022-03-23 09:44:15 1.58MB JupyterNotebook
1
推荐SYS_with_movielens 使用FunkSVD,FM,itemCF / UserCF,使用残差网络的宽带和深度,使用残差网络的deepFM等构建ResSys。我尝试尽快收集所有算法。 我提供了一些基于movielens的算法 SVD: FunkSVD: BiasSVD: SVD ++ 因子分解机:FM 协同过滤 深度学习(tensorflow 2.x)宽而深 深度fm NFM
2021-12-20 09:33:44 41KB JupyterNotebook
1
DeepFM实战源码
2021-06-22 09:00:12 148KB DeepFM python 推荐算法
1
DeepFM原文论文
2021-06-22 09:00:11 1.03MB DeepFM
1
DeepFM实战的数据集
2021-06-22 09:00:10 76.53MB DeepFM
1
yellowfin包
2021-06-21 09:00:07 8KB python 深度学习 推荐系统
1
文章目录摘要一、数据预处理部分二、DeepFM部分1、FM部分的特征向量化2、Deep部分的权重设置3、网络传递部分4、loss5、梯度正则6、完整代码三、执行结果和测试数据集 摘要 DeepFM原理部分可以参看博客https://blog.csdn.net/weixin_45459911/article/details/105359982,本文就着重介绍其代码复现部分的内容。 本文所写的代码参考自https://www.jianshu.com/p/71d819005fed,在此基础上进行了一些修改,并增加了注释。 一、数据预处理部分 import pickle import pandas a
2021-06-03 12:18:35 153KB ep
1
deepfm CTR预估 解决高维稀疏矩阵训练深度网络带来的问题
2021-01-28 05:02:56 10KB 机器学习
1