DouBanRecommend 基于豆瓣图书的推荐、知识图谱与知识引擎简单构建neo4j 本项目主要贡献源来自豆瓣爬虫(数据源)、知识图谱引擎、中内嵌的推荐算法。 主要拿来做练习,数据来源可见。 练习内容: 豆瓣图书推荐 + 搜索模块 豆瓣图书知识库简单应用(Neo4j的使用) 推荐与搜索模块再结合豆瓣内部的API就更加牛逼~~~!() 20210130 更新 将book_excel.csv压缩成book_excel.zip放在文件夹book_recomend下面 一、数据整理 简单的把爬虫数据进行简单的整理。主要做了一下针对每本书的评分,数据源中有两个值得用的字段:豆瓣书籍评分 + 书籍阅读人数,先等级化,然后进行平均,简单的得到了该书籍的得分。 # 把豆瓣读书评分 / 豆瓣读书人群数量 进行分箱 book_excel_all['rank_rank'] = pd.qcut(book_ex
2021-12-29 00:03:32 14.12MB Python
1
爬取豆瓣网图书TOP250的信息,只有一级网页结构,可以帮助初学时入门。
2021-12-25 20:26:18 116B Scrapy 豆瓣图书信息
1
Spider_DouBan_Book 帮大四学长的毕设搞一点豆瓣的图书数据,已经上传了sql文件,只爬了3000+本书,15000+评论数据,数据库Mysql。
2021-12-20 22:03:09 5.93MB Java
1
douban #这是我写的第一个爬取豆瓣图书信息的爬虫代码, #爬取了400条关于图书信息的数据 #每条数据包括书名、作者及翻译、出版社、价格、出版时间、评分、评论人数。 #把抓取数据的过程封装成Data(url)的函数,循环 20次来抓取前20页的数据, #如果想要更多的数据只要把"for i in range(0,399,20):"里面的399改成x,其中(x+1) =0 #如果还有问题请给我发邮件
2021-12-17 17:55:25 2KB Python
1
基于Python的豆瓣图书评论数据获取与可视化分析.pdf
2021-12-10 19:50:46 942KB Python 程序 数据处理 专业指导
该文件为豆瓣上评分排行前250的图书信息数据,数据爬取文章网址:https://blog.csdn.net/LEEBELOVED/article/details/83790006
2021-11-18 13:00:58 45KB 豆瓣图书 爬虫 R语言 多线程计算
1
python编译的爬取豆瓣图书的代码,粗糙但是能用,实现基本的原理,易于理解,为了凑足五十个字不容易
2021-11-02 17:09:39 1KB python编译的爬取豆瓣图书的
1
源代码:网站制作豆瓣图书
2021-09-25 14:01:59 70KB
1
1、本爬虫是爬取豆瓣网站上的TOP 250 图书信息,相关网址:https://book.douban.com/top250 2、本爬虫用到的模块 有 requests,lxml,time 注: 本程序只作为业余学习,程序中,对于“IndexError: list index out of range”报错,已经做了完美解决。
2021-09-10 18:13:33 2KB python
1
最近微信小程序被炒得很火热,本人也抱着试一试的态度下载了微信web开发者工具,开发工具比较简洁,功能相对比较少,个性化设置也没有。了解完开发工具之后,顺便看了一下小程序的官方开发文档,大概了解了小程序的开发流程和一些常用的API。 了解了小程序之后,自己就有了想要做一个小demo的冲动,虽然自己对小程序还没有做过很多实践,只是在官方例子上徘徊,但是还是想做出点小东西。既然要做一个demo,自然需要到数据,自己有又不想独自搭建服务端,所以在网上搜索可以用来提供测试数据的免费api,最后我选择了豆瓣图书豆瓣图书提供的api功能比较少,加上不开放appkey申请,所以无法操作用户数据。只能做点简单
2021-08-28 17:06:32 153KB padding 微信 微信小程序
1