基于Mahout的新闻推荐系统
相关技术
推荐算法
基于用户的协同过滤
基于内容的推荐
基于景点的推荐
:整体框架,实现了协同过滤
,建立VSM
:分词,关键词提取
:分词,关键词
:提供API,ORM
关键实现
基于用户的协同过滤
直接调用Mahout相关接口即可
选择不同的用户相似度度量方法,这里选择了基于谷本系数,基于对数似然和基于曼哈顿距离
基于内容的推荐
对新闻文本进行分词
调用Deeplearning4j中内置paragraphvector的方法,通过doc2vec内置VSM
用Gensim会更方便点
基于景点的推荐
统计最高浏览量
过滤一定时间前的新闻保证景点的准确
评估指标
F1-Measure(精度+召回率)
算法
最近邻数量K
推荐数N
F1-措施
UserCF--Tanimoto
20
11
0.481591183699049
UserCF--Log
2021-12-26 22:46:42
14.93MB
系统开源
1