本项目使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务。 推荐系统在日常的网络应用中无处不在,比如网上购物、网上买书、新闻app、社交网络、音乐网站、电影网站等等等等,有人的地方就有推荐。根据个人的喜好,相同喜好人群的习惯等信息进行个性化的内容推荐。比如打开新闻类的app,因为有了个性化的内容,每个人看到的新闻首页都是不一样的。 这当然是很有用的,在信息爆炸的今天,获取信息的途径和方式多种多样,人们花费时间最多的不再是去哪获取信息,而是要在众多的信息中寻找自己感兴趣的,这就是信息超载问题。为了解决这个问题,推荐系统应运而生。 协同过滤是推荐系统应用较广泛的技术,该方法搜集用户的历史记录、个人喜好等信息,计算与其他用户的相似度,利用相似用户的评价来预测目标用户对特定项目的喜好程度。优点是会给用户推荐未浏览过的项目,缺点呢,对于新用户来说,没有任何与商品的交互记录和个人喜好等信息,存在冷启动问题,导致模型无法找到相似的用户或商品。
2021-12-24 20:07:54 27.08MB Spark
1
该资源为本地Windows下pyspark环境搭载,包含python、spark、hadoop、jdk、anaconda3、jupyter notebook(可参考资源进行搭载)如遇问题请查看专栏中的报错解决,亦可私信联系我
2021-12-24 17:08:34 1.81MB 本地spark环境搭载
1
主要介绍了Linux下搭建Spark 的 Python 编程环境的方法,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
2021-12-24 12:45:36 134KB linux搭建spark python 环境
1
spark 最新技术架包,具体说名请找度娘。知道的人可以下载
2021-12-24 09:04:42 110KB spark jar zip
1
greenplum-spark_2.11-1.6.2.jar,csdn 下载需积分,可私信获取百度云链接
2021-12-23 17:31:59 3.2MB greenplum spark greenplum-spark_
1
Spark推荐系统 在此项目中,目标是使用备用最小二乘(ALS)算法在Spark上构建推荐系统。 该数据集来自Kaggle竞赛,名为“ WSDM-KKBox的音乐推荐挑战赛”,其中包含用户收听歌曲的信息,播放来源等。 通过利用这些数据和适当的特征工程,可以从该数据中识别出最感兴趣的类型,艺术家和语言用户,并轻松推荐该类别中的热门歌曲。
2021-12-23 10:46:59 13KB JupyterNotebook
1
spark-2.4.3-bin-hadoop2-without-hive_hadoop3.2
2021-12-23 10:31:24 132.03MB spark 2.4.3 hadoop3.2
1
大数据实验报告Spark编程实现TopN和InvertedIndex程序.doc
2021-12-23 09:13:22 356KB Spark编程 TopN InvertedIndex 大数据实验
PySpark大数据处理及机器学习Spark2.3视频教程,本课程主要讲解Spark技术,借助Spark对外提供的Python接口,使用Python语言开发。涉及到Spark内核原理、Spark基础知识及应用、Spark基于DataFrame的Sql应用、机器学习等内容。由浅到深的带大家深入学习大数据领域最火的项目Spark。帮助大家进入大数据领域,抓住大数据浪潮的尾巴。
2021-12-22 09:09:29 529B PySpark Spark 大数据 机器学习
1
项目以宜信贷风控系统实时数据采集系统为背景,主要描述了技术架构、核心技术难点及代码实现全过程,涉及技术包括但不限于:Kafka\zookeeper,Spark,SparkStreaming,HBase,实时访问技术,爬虫技术等
2021-12-21 22:34:26 1.43MB 大数据 Kafka Spark SparkStreami
1