上传者: 42101720
|
上传时间: 2021-12-19 21:43:06
|
文件大小: 4.14MB
|
文件类型: -
文章推荐系统
在这个项目中,我分析了用户与IBM Watson Studio平台上的文章之间的交互,并向他们提出了我认为他们喜欢的新文章的建议。
我的项目分为以下任务
I.探索性数据分析
提供一些有关数据的描述性统计以及数据可视化的见解。
二。 基于排名的建议
提供功能以获取用户订阅数量最多的前n个文章名称和ID。
三, 基于用户-用户的协同过滤
提供功能以从与输入用户ID相似度最高的用户那里获得前n条文章订阅。
以用户为行,文章为列,重塑数据框。
每个用户只能在每行中出现一次。
每篇文章只能显示在一个栏中。
如果用户对文章进行了下标,则在用户行与文章列相交处放置1。
否则,在用户行遇到该文章列的地方放置一个0。
IV。 基于内容的协同过滤
提供获取与输入文章ID相似度最高的前n个文章名称和ID的函数。
利用NLP技术删除标点符号,停用词并标记文档正文文本。
通过Ge