原网址下载速度过慢,这里放到本地。imdb电影评分数据集,包含pkl和npz的格式
2021-10-28 14:43:02 51.21MB imdb 电影评分
1
Keras用IMDB数据源(imdb.npz + imdb_word_index.json)
2021-07-23 19:06:15 17.27MB 神经网络 keras 数据集
1
ACL IMDb 数据集
2021-05-19 16:08:39 284.36MB ACL 数据集 IMDb
1
INSE6180 使用3个研究论文的数据挖掘算法实现。 该项目使用所有上述算法对从IMDb数据库获得的数据进行ML分析。 这些算法(朴素贝叶斯算法,决策树算法和支持向量机)在不同的数据集上效果最佳,但为了使它们更公平,已使用了新的IMDb数据库。 首先,对数据进行清洗,预处理,修剪然后整合,以便为分类器提供可能的最佳有意义数据。 考虑到要进行分析,分类器从头开始用Python语言编写了脚本。 最后,在已开发的分类器中进行分析,并进行比较研究。 队友:Gursimran Singh –40080981 Ufuoma Ubor-40072909 Darshan Dhananjay –40079241 Ashmeet Singh -40070369 V. Subramaniyaswamy,MV Vaibhav,RV Prasad和R. Logesh,“使用多元回归和SVM预测电影票房成功
2021-05-11 20:09:35 2.63MB Python
1
IMDB数据集,包括 5035部电影的IMDB评分,评分人数,主要导演,主要演员,评论人数,预算及票房,电影类型及出品年份国家。
2021-03-20 21:56:21 1.41MB 电影评分 IMDB 电影数据集 数学建模
1
情感分类 情感分类 情感分类是分析一段文本并预测某人是否不喜欢他们在说的事情的任务。 输入:一段文字 输出:情绪 数据集 我正在使用进行模型训练,它包含两列 前处理 代币化 令牌化是将文本,短语,句子,文档分成较小的“块”或“令牌”的过程 例如: “嘿,好久不见了” 令牌: “嘿”,“有”,“长”,“时间”,“否”,“看到” 通过定位单词边界来创建较小的单位或令牌,单词边界是单词的终点和下一个单词的开头。 排序和填充 排序用于将我们的文本用作神经网络中的输入层 “嘿,那里”,“嘿,那里儿” [['1 2'],['1','2','3']] 进行填充以使向量输入具有相同的大小 [[1,2] [1,2,3] 语料库将具有不同大小的句子,如上面的示例所示。 进行填充以使其大小相同 [[0 1 2] [1 2 3] 模型 该模型架构是使用tf.keras.utils.plot
2021-03-09 19:05:16 4.73MB JupyterNotebook
1
利用Python爬取douban和IMDB电影评分前50名的电影的数据,包括影名、导演、主演、出演日期、电影类型、评分以及评价人数等
2021-01-11 17:36:46 3KB Python爬虫 豆瓣top50 IMDB的top50
1
IMDB数据集有5万条来自网络电影数据库的评论;其中2万5千条用来训练,2万5千条用来测试,每个部分正负评论各占50%.
2020-03-24 03:03:05 52.58MB NLP
1
imdb.npz 电影评论数据集 当我们按照教程书籍里面的代码试验时,往往会出现数据集下载失败的问题. 执行 (train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000) 出现Downloading data from https://s3.amazonaws.com/text-datasets/imdb.npz,网络连接失败。 此时,将下载好的imdb.npz文件放在主目录下的 .keras/datasets文件夹下即可。
2019-12-21 21:47:19 16.66MB imdb数据 电影情感二分
1
IMDB电影数据集含有50000个电影评论,分为正反两类。train包中包含25000个正反类评论用于训练,test中包含25000个评论用于测试。
2019-12-21 21:39:16 41.1MB IMDB数据集
1