IMDB_Sentiment_Analysis 鉴于大量的在线评论数据(Amazon,IMDB等),情绪分析变得越来越重要。 在这个项目中,建立了一个情感分类器,用于评估一段文字的极性是正还是负。 情感分析是在Keras随附的IMDB数据集上完成的。 它由25,000个训练样本(其中20%是验证样本)和25,000个测试样本组成。 数据集中的所有单词均已预先标记。 使用自训练的单词嵌入(Keras嵌入层)。 我训练了不同的模型,其中一个模型包含一个LSTM层。 它在10个时元上的准确度为84%。 第二个示例由两组Conv1D和MaxPooling1D图层组成,后面是标准GRU图层。 观察到85%的准确性。 我已经将CuDNN层用于LSTM和GRU,因为它们在GPU上的速度比标准LSTM和GRU层快得多。 所有实现都是使用Keras进行的。 另一个具有RMS Prop精度的示例为84%,而
2021-12-21 16:05:55 95KB JupyterNotebook
1
IMDB-评论 对 IMDB 电影评论的情感分析 大纲 数据集 特征提取 计数向量化器 TF-IDF 分类模型 朴素贝叶斯 多元伯努利分布 多摩尔分布 随机森林 深度学习 超参数优化 附加平滑参数 临界点
2021-12-20 00:43:48 3.55MB Python
1
斯坦福的IMDb数据集(Stanford's Large Movie Review Dataset)作为⽂本情感分类的数 据集
2021-12-14 16:36:55 80.23MB 斯坦福 IMDb数据集 aclImdb_v1.tar.g
1
六度分离 这是我用Java编写的一个程序,用于将六度分离的概念应用到电影行业中。 程序的功能是这样的:用户可以输入两个女演员的名字,程序会分析并绘制一个图表来显示这两个人之间的联系。 也就是说,如果他们出现在同一部电影中,程序就会找到他们所投的电影; 否则,该程序将使用链将他们与与他们一起出演同一部电影的其他女演员联系起来。 我使用的数据来自iMDB开源数据库,可以在这里下载。 ftp://ftp.fu-berlin.de/pub/misc/movies/database/ 运行程序时,记得将数据upzip 并与java 代码放在同一目录中。
2021-12-12 20:34:23 6KB Java
1
卷积神经网络(CNN)的文本分类 这是一个使用CNN对文本文档/句子进行分类的项目。 您可以在和的博客条目中找到类似方法的精彩介绍。 我的方法与Denny和Yoon Kim的原始论文[1]相似。 您也可以在找到Yoon Kim的实现。 ***更新***-2019年12月15日:版本0.2.0的更改 我已将代码更新为TensorFlow2。此外,我在jupyter笔记本中进行了一些更改: 删除Yelp数据集 为IMDB添加TensorFlow数据集 ***更新***-2019年5月17日:0.1.0版中的更改 模型: 将字级与基于字符的输入相结合。 char输入ist是可选的,可以用于进一步
2021-12-10 12:48:35 209KB nlp deep-learning text-classification tensorflow
1
IMDB 的人脸数据集 共100个文件夹以及一份标签数据 文件集非常大(6.5G),故分成10份传,本部分为00~09部分
2021-12-06 22:17:42 605.59MB 人脸 数据集 年龄 性别
1
:desktop_computer: Imdb-Web-Scraper :desktop_computer: 在imdb网站中对电影进行网络抓取 请安装以下配件: 从下载chromdriver 点安装枕头 点安装Selenium 点安装枕头 点安装请求 如何操作工具: :glowing_star: 第一步: 打开命令行或pycharm并运行scraper.py: :glowing_star: 第二步: 在搜索框中输入要搜索的电影,然后单击搜索按钮 :glowing_star: 第三步: Google chrom浏览器将打开,并且开始网络抓取过程,请等待几分钟,直到该过程完成并操作movie.txt文件 :glowing_star: 第四步: 程序完成后,转到Scraper.py文件夹,然后输入已对所有电影详细信息进行操作的movie.txt文件
2021-12-06 19:57:34 61.43MB Python
1
使用PyTorch进行情感分析 存储库将引导您完成构建完整的情感分析模型的过程,该模型将能够预测给定评论的极性(无论表达的观点是肯定的还是负面的)。 要在其上训练模型的数据集是流行的IMDb电影评论数据集。 目录 第一个笔记本涵盖了从原始数据集中加载数据,特征提取和分析,文本预处理以及训练/验证/测试集准备的过程。 第二篇教程包含有关如何设置词汇对象的说明,该对象将负责以下任务: 创建数据集的词汇表。 根据稀有词出现和句子长度过滤数据集。 将单词映射到其数字表示形式(word2index)和反向(index2word)。 启用预训练词向量的使用。 此外,我们将构建BatchItera
1
IMDB电影评论 imdb.csv
2021-11-05 14:39:01 25.38MB 数据集
1
数据包括IMDB网站上抓取的5043部电影28个属性信息,4906张海报,电影时间跨度超过100年和66个国家,并包括2399位导演和数千位演员。属性包括:电影名称、评论数、评分、导演、上映时间、上映国家、主要演员、语言、IMDB评分等。
2021-11-04 00:55:07 580KB 电影数据 电影信息 Kaggle
1