使用协同过滤算法计算用户偏好,用了多个MapReduce处理该业务,每次生成的文件存储在集群上,最后实现JobContorl,并将所需数据存储到mysql中
2021-04-11 16:57:28 188KB hadoop 协同过滤 hdfs MapReduce
1
在2015年3月21日的北京SparkMeetup第六次活动上,尹绪森就如何使用PredictionIO打造一个定制化推荐引擎进行了详细介绍,白刚则分享了新浪在大规模多标签分类上的探索。在2015年3月21日的北京SparkMeetup第六次活动上,一场基于Spark的机器学习专题分享由微软JulienPierre、新浪网白刚与Intel研究院尹绪森联手打造。JulienPierre首先进行了开场发言,并为大家分享Spark在ASG团队的应用情况。通过Julien了解到,其团队主要工作集中在SparkSQL和MLlib两个组件,基于Spark做一些交互式分析,其中包括:将Spark与现有的查询
1