DouBanRecommend
基于豆瓣图书的推荐、知识图谱与知识引擎简单构建neo4j
本项目主要贡献源来自豆瓣爬虫(数据源)、知识图谱引擎、中内嵌的推荐算法。
主要拿来做练习,数据来源可见。
练习内容:
豆瓣图书推荐 + 搜索模块
豆瓣图书知识库简单应用(Neo4j的使用)
推荐与搜索模块再结合豆瓣内部的API就更加牛逼~~~!()
20210130 更新
将book_excel.csv压缩成book_excel.zip放在文件夹book_recomend下面
一、数据整理
简单的把爬虫数据进行简单的整理。主要做了一下针对每本书的评分,数据源中有两个值得用的字段:豆瓣书籍评分 + 书籍阅读人数,先等级化,然后进行平均,简单的得到了该书籍的得分。
# 把豆瓣读书评分 / 豆瓣读书人群数量 进行分箱
book_excel_all['rank_rank'] = pd.qcut(book_ex
2021-12-29 00:03:32
14.12MB
Python
1