Keras用IMDB数据源(imdb.npz + imdb_word_index.json) from tensorflow.keras.datasets import imdb (train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000) # word_index is a dictionary mapping words to an integer index word_index = imdb.get_word_index() # We reverse it, mapping integer indices to words reverse_word_index = dict([(value, key) for (key, value) in word_index.items()]) # We decode the review; note that our indices were offset by 3 # because 0, 1 and 2 are reserved indices for "padding", "start of sequence", and "unknown". decoded_review = ' '.join([reverse_word_index.get(i - 3, '?') for i in train_data[0]])
2022-12-05 21:47:55 17.27MB imdb keras
1
利用python中的深度学习库keras,对IMDB电影数据集建立了神经网络模型进行分析,涉及原始电影数据的词嵌入处理技术,附有完整的Python代码以及注释。
2022-11-23 11:50:45 70KB 神经网络 keras 深度学习 python
1
imdb数据集:用于文档分类。
2022-10-26 16:59:14 154.07MB 分类 数据挖掘 人工智能 机器学习
1
IMDB数据IMDB数据
2022-07-06 16:06:42 17.26MB 数据集 机器学习 深度学习
1
IMDB_TextAnalysis 通过IMDB数据集评论上的训练模型将输入文本分为正面还是负面。
2022-05-15 22:09:43 7KB JupyterNotebook
1
CSV格式的IMDB数据集(情感分析) IMDB电影评论数据集转换为CSV文件 Test.csv Train.csv Valid.csv
2022-03-02 16:41:58 25.3MB 数据集
1
IMDB_Sentiment_Analysis 鉴于大量的在线评论数据(Amazon,IMDB等),情绪分析变得越来越重要。 在这个项目中,建立了一个情感分类器,用于评估一段文字的极性是正还是负。 情感分析是在Keras随附的IMDB数据集上完成的。 它由25,000个训练样本(其中20%是验证样本)和25,000个测试样本组成。 数据集中的所有单词均已预先标记。 使用自训练的单词嵌入(Keras嵌入层)。 我训练了不同的模型,其中一个模型包含一个LSTM层。 它在10个时元上的准确度为84%。 第二个示例由两组Conv1D和MaxPooling1D图层组成,后面是标准GRU图层。 观察到85%的准确性。 我已经将CuDNN层用于LSTM和GRU,因为它们在GPU上的速度比标准LSTM和GRU层快得多。 所有实现都是使用Keras进行的。 另一个具有RMS Prop精度的示例为84%,而
2021-12-21 16:05:55 95KB JupyterNotebook
1
斯坦福的IMDb数据集(Stanford's Large Movie Review Dataset)作为⽂本情感分类的数 据集
2021-12-14 16:36:55 80.23MB 斯坦福 IMDb数据集 aclImdb_v1.tar.g
1
使用PyTorch进行情感分析 存储库将引导您完成构建完整的情感分析模型的过程,该模型将能够预测给定评论的极性(无论表达的观点是肯定的还是负面的)。 要在其上训练模型的数据集是流行的IMDb电影评论数据集。 目录 第一个笔记本涵盖了从原始数据集中加载数据,特征提取和分析,文本预处理以及训练/验证/测试集准备的过程。 第二篇教程包含有关如何设置词汇对象的说明,该对象将负责以下任务: 创建数据集的词汇表。 根据稀有词出现和句子长度过滤数据集。 将单词映射到其数字表示形式(word2index)和反向(index2word)。 启用预训练词向量的使用。 此外,我们将构建BatchItera
1
下载后解压到~/.keras/datasets目录下,代码中无需指定路径,imdb.load_data()默认优先从datasets读取数据。
2021-10-28 19:22:38 16.66MB IMDB 数据集
1