豆瓣读书爬虫,保存到excel中(2021.6.28可用)
2021-06-28 11:04:08 7KB 豆瓣读书 excel
基于社交网络的电影票房分析--以豆瓣电影和新浪微博为例,郑玲,李昕,近年来随着互联网技术飞快进步,社交网络媒体层出不穷,移动互联网的到来,使得人们参与网络社交更加便利,越来越多的研究人员开
2021-06-26 14:57:56 599KB 计算机软件
1
在这个豆瓣电影分析与推荐系统中,我们使用了PYTHON语言来编写整个项目代码,分析所需数据完全利用爬虫爬取得到,爬取所得的数据被存入MYSQL数据库中,取得的数据被用作两个方面。 其一,被爬取得到的数据被用于进行电影分析,我们将爬取到的top300部电影的信息按照影片发行国家和影片类型进行了分析并制作了图表来直观显示受欢迎的电影的分类。 其二,我们利用了一种用于推荐系统的算法---协同过滤算法,来为每位参与电影评分的用户筛选出推荐电影内容,首先读入数据,形成用户-电影矩阵,其次根据用户-电影矩阵计算不同电影之间的相关系数(一般用person相关系数),形成电影-电影相关度矩阵。然后根据电影-电影相关度矩阵,以及用户已有的评分,通过加权平均计算用户未评分电影的预估评分。例如用户对A电影评3分、B电影评4分、C电影未评分,而C电影与A电影、B电影的相关度分别为0.3和0.8,则C电影的预估评分为(0.3*3+0.8*4)/(0.3+0.8)。 然后,我们实现了一些创新的功能。首先,我们爬取网页当中电影的数据,对网页当中的电影数据进行分析,分类,确定不同类型电影的百分比。然后我们分析用户对不同类型电影的打分情况,运用同类分析的方法对用户进行推荐其可能感兴趣的电影
2021-06-26 13:08:49 591KB 豆瓣电影 数据分析 推荐系统
50个微信小程序源码: AppleMusic B站首页界面设计:附详细教程 cnode社区版 dribbble FlexLayout布局 gank HIapp IT-EBOOK leantodu LOL战绩查询 movecss效果 Railay:整体框架 redux绑定 TCP,IP长连接 todo list v2ex 东航订机票 二维码生成器 仿微信DEMO 仿找事吧 仿网易云音乐 会议精灵 侧滑布局 分答小程序 创客+实现大量功能,推荐研究 剪刀石头布 城市切换 备忘录 大转盘 家居电商 富文本解析,折线图,MD5,bluebird 机器人兔兔 极客学院 果库 查拼音 步步高字典 滑动选项卡 滴滴公交-查公交 电商-拼团 倒计时 电商小程序 电影推荐 电影日历 画布:时钟 番茄时钟 百度小说 简易计算器 豆瓣图书 豆瓣电影 货币汇率 购物车 车源宝 辩论倒计时 高仿苹果计算器
豆瓣电影推荐系统——通过爬取电影数据和用户数据,再利用所爬取的数据设计并实现相关推荐算法对用户进行电影推荐。然后设计出图形用户界面(GUI)进行交互,封装成电影推荐软件,针对数据集中的用户推荐相关电影。 **主要分为三大模块:** :one: 爬虫模块:request 库、json 库、MySQL :two: 推荐系统模块:基于物品的协同过滤算法(ItemCF 算法) :three: GUI 模块:PyQt5 **开发环境:Python 3.7.7**
2021-06-24 16:03:04 123.23MB Python request 爬虫 电影推荐
数据分析与挖掘案例之使用python抓取豆瓣top250电影数据进行分析-附件资源
2021-06-24 13:28:56 106B
1
Python豆瓣电影评论爬虫(request)
2021-06-23 19:07:36 6KB Python 豆瓣电影 评论
爬取豆瓣电影短评并制作词云
2021-06-23 19:07:35 8.41MB 词云 豆瓣电影
1
用爬虫爬取豆瓣电影TOP250,并用PythonTkinter实现GUI展示与电影信息检索
2021-06-23 19:07:35 16KB Tkinter 检索 豆瓣电影 TOP250
一个豆瓣电影的爬虫 requests+beautifulsoup 构建数据库,之后运行python pipeline.py即可 流程: 1) 从高分电影top200爬取200个电影数据。 2) 爬取每个未爬过的电影的演员信息,top100评论信息,以及评论对应的用户信息 3) 从未爬过的用户看过的信息中爬取该用户看过的电影。 4) 循环上述2和3过程
2021-06-23 19:07:34 29.38MB 豆瓣电影