自述文件 该项目基于Hadoop和Hive。 如果您尚未设置它们,请参考以下说明: & 。 您可以从下载我们的测试数据。 README.txt具有有关其数据属性的非常详细的说明。 在wirteup中也有描述。 请将给定数据集中的::替换为 (这是一个标签)。 只要使其更容易处理即可。 请将目录更改为刚刚下载的数据文件。 对我来说是$cd ~/ml-1m 请启动hadoop,这是Hive运行的先决条件。 输入命令$hive -f extract.q 。 将出现目录“结果”。 它存储我们要使用的数据。 我们已经在源文件中提供了这样提取的数据,称为new_data.txt 。 在HDFS上创建文件夹,我们将数据放入文件夹: $ hadoop fs -makedir /hadoop 将数据放在HDFS上: $ hadoop -fs copyFromLocal /directory of
2022-12-02 20:42:13 84.58MB Java
1
基于知识图嵌入的推荐系统 基于知识图嵌入的推荐系统 本系统是一个基于知识图嵌入的商品推荐系统,以下是该系统的详细介绍,基本代码都是自己所写,TransE和Rescal方法实现部分是照着论文与相关代码自己进行的复现,并且相关代码中都有我写的一些注释。 1.generate_data.py是用于生成模拟数据,在进行真实使用时可以参照所生成的模拟数据的格式进行数据录入 2.data文件夹下需要有entities.txt以及relations.txt两个数据,他们分别是实体(people和items)的名称以及索引号,以及关联的名称以及索引号,关联也可以有多种,然后该文件夹下还应该有train.txt,valid.txt和test.txt,作为模型训练的依托,其中的neg.txt可要可不要,这个文件并不参与模型的训练过程 3.dataset.py文件主要是模型训练中处理数据的代码,model.p
2022-11-21 21:20:29 1.77MB 系统开源
1
协同过滤音乐推荐 (Docker 部署) 协同过滤 音乐推荐 深度学习 音乐检索 Docker @[toc] 介绍 项目主要工作在 Million Song Dataset 数据集下基于 Python 的 scikit-surprise 库实现了基于协同过滤的音乐推荐,还有用 CNN (卷积神经网络) 实现相似音乐推荐。 其中,协同过滤主要基于 Python scikit-surprise 库的 写的协同过滤算法, 所采用的数据集的原因,协同过滤出来的指标比较低,系统中协同过滤的结果采用三个算法输出的结果投票。 另外就是参照下面的参考项目做了基于深度学习的音乐推荐,该项目主要实现相似相似旋律的音乐推荐。其主要通过 CNN 对音乐音频信息进行特征提取,然后对提取后的特征向量与实现保存好的一些音乐特征向量进行相似度匹配,将相似度最高的几首音乐作为推荐结果。该方法可以用于音乐检索,音乐防抄袭
2022-09-02 15:55:34 68.25MB PHP
1
电影推荐系统使用自动编码器和DNN 混合自动编码器和基于DNN的电影推荐模型
2022-07-02 15:50:32 1.4MB JupyterNotebook
1
使用机器学习和Flask的游戏推荐系统 这是我开发的一个游戏推荐系统项目,目的是将一些机器学习技术付诸实践,因此目标是使用户添加他已经玩过的游戏并将其添加到他的个人资料中,并在以后收到推荐。新游戏。 项目结构 . └── Game-Recommendation-System ├── __init__.py # setup our app ├── auth.py # the auth routes for our app ├── Games.db # our database ├── main.py # the non-auth routes for our app ├── models.py
2022-06-18 01:42:50 4.72MB JavaScript
1
蒸汽推荐系统 基于Steam用户库数据集中的协同过滤(皮尔逊相似系数)的推荐系统。 Pandas用于大多数数据操作,其中一些字符串函数用于非Unicode,非字母数字文本清除。 此外,Flask和JS用于前端。 数据整理 在建立此推荐系统时使用了两个数据集。 首先是来自Kaggle的。 这是为了将游戏名称标识为其应用程序ID,这是必需的,因为其他数据集(不包含应用程序ID)以用户每个游戏小时的小时数的形式包含隐式评级。 用户数据集也来自Kaggle。 隐式评级 用户数据集包含每个用户的数据 玩游戏 为了 小时。 我所做的是将隐式的评分时间转换为从1到5的显式评分。 只需将额定值线性映射到范围即可实现 在哪里 是平均游戏小时数 在整个数据集中播放。 端点数据集 此数据集是使用我们数据集中的游戏者的appid与包含游戏标头图像的媒体数据集的内部连接生成的。 该数据集用于检索浏览器中前端的媒
1
Learning Binary Code for Personalized Fashion Recommendation
2022-06-05 22:00:12 3.25MB 研究论文
1
IT_销售带推荐系统 Python-Django网络应用程序,根据客户以前在公司购买的产品为客户推荐产品,推荐系统为Apriori算法。
2022-06-05 19:08:41 9.05MB python sales django recommendation-engine
1
音乐推荐系统 分析了一个包含 7.17 亿个评分的数据集,并为用户开发了音乐推荐系统。 生成图表以查找音乐行业中各种流派的趋势。
2022-05-30 19:52:02 22KB Java
1
项目Steam游戏推荐系统 1概述 关键字:推荐系统,协作过滤,Spark,Hive,Flask,Web爬网程序,AWS EC2,AWS RDS 1.1引言 推荐系统在最近几年变得越来越流行,并且广泛用于电影,音乐,新闻,书籍,研究文章,搜索查询,社交标签和产品等各个领域。 推荐系统或推荐系统是信息过滤系统的子类,其试图预测用户将给予商品的“等级”或“偏好”。 在这个项目中,我通过Spark的ALS(交替最小二乘)API(pyspark.mllib.recommendation.ALS)在Spark上使用协作过滤算法,实现了游戏推荐系统。 协作过滤方法是基于收集和分析有关用户的行为,活动或偏好的大量信息,并基于与其他用户的相似性来预测用户的喜好。 1.2架构 整个项目分为三个阶段: 通过Web爬网程序收集数据 Spark上的游戏推荐引擎 Web UI实施 该项目的体系结构如下所示:
2022-05-27 01:11:18 9.52MB 系统开源
1