是大数据课程大作业,基于Hadoop的电影影评数据分析,需要安装Hadoop,了解MapReduce 和HDFS。
2024-04-22 15:09:31 1.49MB hadoop 数据分析
1
1.2提出问题为了获取、分析消费者喜好相关信息,本项目将通过Python网络爬虫获取主流电影评分网站豆瓣上关于《复仇者联盟4》评论用户的基本信息、影评内容等数据
2023-09-12 19:54:54 593KB
1
对下载的IMDB数据集中的test和train分别进行预处理从而方便后续模型训练,代码为PreProcess.py。预处理主要包括:大小写转化、特殊字符处理、stopwords过滤、分词,最后将处理后的数据存储为CSV格式,以方便后续调试。借用了nltk的 stopwords 集,用来将像 i, you, is 之类的对分类效果基本没影响但出现频率比较高的词,从训练集中清除。
2023-03-01 16:29:27 1KB pytorch RNN lstm 情感分类
1
今天小编就为大家分享一篇关于使用Python抓取豆瓣影评数据的方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
2022-12-30 14:38:45 160KB python 抓取 python 数据抓取
1
IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据集IMDB影评数据
著名的影评数据集imdb.zip里面包含原生数据集raw,train和text数据集分别含有pos和neg样例集
2022-02-07 19:25:35 109.03MB 著名的影评数据集imdb
1
以IMDB影评数据为基础,从BERT数据预处理、Input Embeddings、模型代码实现、矩阵内部信息分析到线上部署测试,帮助建立BERT模型训练和服务部署的全生命周期。
2021-11-28 21:07:57 205.34MB BERT
1
下载后解压到~/.keras/datasets目录下,代码中无需指定路径,imdb.load_data()默认优先从datasets读取数据。
2021-10-28 19:22:38 16.66MB IMDB 数据集
1
使用动态IP池+cookie爬取豆瓣豆瓣影评数据
2021-10-18 15:07:49 3.11MB 豆瓣 影评
1
本宝宝采集的豆瓣20万条影评原始数据集,希望大家积极下载,尊重宝宝的劳动成果,后期有时间我还为大家提供数据集哈。 机器学习,nlp,深度学习的宝宝赶快看过来,看过来哈。 数据集格式: title##star##comment 电影名称##评论星级(1-5星)##评论内容
2021-07-15 21:45:58 19.93MB nlp 情感分析 豆瓣影评 影评数据
1