AclImdb – v1 Dataset 是用于二进制情绪分类的大型电影评论数据集,其涵盖比基准数据集更多的数据,其中有 25,000 条电影评论用于训练,25,000 条用于测试,还有其他未经标记的数据可供使用,该数据集包含原始文本和已处理的单词格式包。
AclImdb – v1 数据集由斯坦福 AI 实验室于 2011 年发布,发布渠道为 计算语言学 协会第 49 届年会论文集:人类语言技术,主要发布人有 Andrew L. Maas、Raymond E. Daly、Peter T. Pham、Dan Huang、Andrew Y. Ng 和 Christopher Potts,相关论文有《Learning Word Vectors for Sentiment Analysis》。
2022-07-13 11:05:37
81.02MB
数据集