使用PyTorch进行情感分析
存储库将引导您完成构建完整的情感分析模型的过程,该模型将能够预测给定评论的极性(无论表达的观点是肯定的还是负面的)。 要在其上训练模型的数据集是流行的IMDb电影评论数据集。
目录
第一个笔记本涵盖了从原始数据集中加载数据,特征提取和分析,文本预处理以及训练/验证/测试集准备的过程。
第二篇教程包含有关如何设置词汇对象的说明,该对象将负责以下任务:
创建数据集的词汇表。
根据稀有词出现和句子长度过滤数据集。
将单词映射到其数字表示形式(word2index)和反向(index2word)。
启用预训练词向量的使用。
此外,我们将构建BatchItera
1