豆瓣电影top250电影即影评爬虫。存入excel表格可用于数据分析和爬虫入门练习。请勿用于非法用途
2021-12-30 19:02:03 376KB 爬虫
1
背景与挖掘目标 获取豆瓣评论数据 分析好评与差评的关键信息 分析评论数量及评分与时间的关系 分析评论者的城市分布情况 1. 背景与挖掘目标 豆瓣(douban)是一个社区网站。网站由杨勃(网名“阿北”) 创立于2005年3月6日。该网站以书影音起家,提供关于书籍、电影、音乐等作品的信息,无论描述还是评论都由用户提供(User-generated content,UGC),是Web 2.0网站中具有特色的一个网站。 网站还提供书影音推荐、线下同城活动、小组话题交流等多种服务功能,它更像一个集品味系统(读书、电影、音乐)、表达系统(我读、我看、我听)和交流系统(同城、小组、友邻)于一体的创新网络服
2021-12-23 11:21:51 136KB 地球 实战 爬虫
1
前段时间奉俊昊的《寄生虫》在奥斯卡上获得不少奖项,我也比较喜欢看电影,看过这部电影后比较好奇其他人对这部电影的看法,于是先用R爬取了部分豆瓣影评,jieba分词后做了词云了解,但是如果不登录豆瓣直接爬取影评只可以获得十页短评,这个数据量我认为有点少,于是整理了python模拟登录豆瓣,批量爬取数据,制作特别样式词云的方法。 一、 用到的Python库 import os ##提供访问操作系统服务的功能 import re ##正则表达式 import time ##处理时间的标准库 import random ##使用随机数标准库 import requests ##实现登录 import n
2021-12-22 08:27:28 847KB jieba python 豆瓣
1
此文件为中国科学院大学深度学习课程实验作业整体整理出来的,包括1、中国科学院大学深度学习课程实验作业——电影评论情感分类(代码+实验报告/2、中国科学院大学深度学习课程实验作业——猫狗分类(代码 实验报告)3、中国科学院大学深度学习课程实验作业——手写数字识别(代码 实验报告)4、中国科学院大学深度学习课程实验作业——自动写诗(代码+实验报告)
本文工作实现了两个模型: Spatial Dropout-GRU模型TextCNN模型,并分别测试了其情感分类效果。 开发环境:python3.6.5、tensorflow==1.12、keras==2.2.4 数据集: 1)训练集。包含2W条左右中文电影评论,其中正负向评论各1W条左右。 2)测试集。包含2w条左右中文电影评论,其中正负向评论各1W条左右。
我在这提供个电影前端网站,看着样子还不错
2021-12-09 10:04:45 6.21MB Htnl
1
观影网站影评信息系统是基于C++开发工具Visual C++ 6.0的源代码,通过C++实现了对影片信息的增删改查和对影片进行实时打分,其中包括,影评人信息的录入、影片信息的录入、影评人对影片信息的选择是哪个项目模块,可以很好的帮助大家理解c++中的可视化窗口编程MVC的理解
2021-11-29 20:40:16 2.98MB c++
1
以IMDB影评数据为基础,从BERT数据预处理、Input Embeddings、模型代码实现、矩阵内部信息分析到线上部署测试,帮助建立BERT模型训练和服务部署的全生命周期。
2021-11-28 21:07:57 205.34MB BERT
1
刚接触python不久,做一个小项目来练练手。前几天看了《战狼2》,发现它在最新上映的电影里面是排行第一的,如下图所示。准备把豆瓣上对它的影评做一个分析。 目标总览 主要做了三件事: 抓取网页数据 清理数据 用词云进行展示 使用的python版本是3.5. 一、抓取网页数据 第一步要对网页进行访问,python中使用的是urllib库。代码如下: from urllib import request resp = request.urlopen('https://movie.douban.com/nowplaying/hangzhou/') html_data = resp.re
2021-11-28 01:51:05 789KB html代码 html语言 python
1
2019GraduationProject 基于spring boot前后端分离的电影影评网站 2019毕业设计,java后台。 采用SpringBoot+MyBatis+Redis+Shiro+Swagger-UI 加入MyMapper的MyBatis通用插件,以及MyBatis自动代码生成工具。
2021-11-28 01:40:14 181KB Java
1