电影评论分类 使用python中的情感分析库将IMDb电影评论分为正面或负面 情绪分析 情感分析是指使用自然语言处理(NLP),文本分析和计算来系统地提取,识别信息并将其分类为特定类别。 该项目使用python sklearn库中的高斯朴素贝叶斯和多项式朴素贝叶斯模型 朴素贝叶斯分类器 朴素贝叶斯分类器是python scikit学习库下的一组监督ML算法。 他们使用特征矩阵(所有因变量的向量)来预测类变量(特征矩阵中每一行的输出)。 这些算法的前提是所有特征彼此独立并且具有同等重要性。 在高斯朴素贝叶斯分类器中,特征的分布遵循高斯/正态分布并形成钟形图。 在多项式朴素贝叶斯分类器中,特征向量表示通过多项式分布生成某些事件的频率。 该分类器非常适合文本分类中的字数统计 关于 该项目从tsv文件读取评论。 使用正则表达式对请求进行清理后,将MNB分类算法应用于数据集。部署的Web应用程序
2022-03-01 10:41:44 610KB JupyterNotebook
1
数据集包括访问者在Trip Advisor上发布的3个迪士尼乐园分支机构(巴黎,加利福尼亚和香港)的42,000条评论。 DisneylandReviews.csv
2022-02-27 21:46:51 10.87MB 数据集
1
亚马逊美食评论50万数据集(Amazon Fine Food Reviews) 之前做评论分类 好不容易找到的数据集 分享了。 需要更多资源请关注。 Github: https://github.com/huangyueranbbc
2022-02-27 13:21:45 353MB spark 大数据 机器学习 亚马逊评论
1
亚马逊上的Analytics(分析)评论 数据分析考试最终项目,。 由 , , 。 探索,情感分析,主题分析(LDA)和VueJS Web应用程序,公开受过训练的模型。 (网络演示部署) 勘探 网络演示 跑 设置一个Python虚拟环境并安装所需的软件包 cd scripts python3 -m venv . source bin/activate pip3 install -r requirements.txt python3 -m spacy download en (可选)安装ipynb内核以使用venv软件包 pip3 install --user ipykernel
1
亚马逊美食评论 Amazon Fine Food Reviews数据集包含568,454条亚马逊用户截至2012年10月的食品评论。 该分析的目的是建立一个预测模型,在此模型中,我们将能够预测推荐是肯定的还是否定的。 在此分析中,我们将不关注分数,而仅关注建议的积极/消极情绪。 涉及程序 该项目是关于文本数据使用的情感分析 nltk库,其中包括PorterStemmer()和word_tokenize(),可将非结构化文本数据更改为结构化文本 使用countvectorizer(将文本文档的集合转换为令牌计数矩阵),TfidfTransformer(以缩小在给定语料库中频繁出现的令牌的影响,因此,从经验上讲,其信息量少于一小部分的功能)来自sklearn库的训练语料库以进行特征提取 朴素的贝叶斯(MultinomialNB,BernoulliNB) 逻辑回归 使用roc曲线,confc
2022-01-11 17:59:05 101KB JupyterNotebook
1
IMDB-评论 对 IMDB 电影评论的情感分析 大纲 数据集 特征提取 计数向量化器 TF-IDF 分类模型 朴素贝叶斯 多元伯努利分布 多摩尔分布 随机森林 深度学习 超参数优化 附加平滑参数 临界点
2021-12-20 00:43:48 3.55MB Python
1
Welcome. This is a Women’s Clothing E-Commerce dataset revolving around the reviews written by customers. Its nine supportive features offer a great environment to parse out the text through its multiple dimensions. Because this is real commercial data,
2021-12-15 19:45:21 2.72MB 数据集
1
使用NLTK进行情感分析 使用NLTK应用于不同数据集的情感分析算法 该存储库包含几个子项目,这些子项目是如何从不同的数据集中执行情感分析的示例。 每个文件夹包含一个不同的项目。 ##使用的工具和安装说明(Ubuntu):### 1。 Python第一个示例已在Linux 64位体系结构下使用Python 2.7.9进行了测试。 但是,为了使用特定的“统计”包,需要使用Python3。 Python3已经随附了默认的Ubuntu安装,因此可以在终端上运行它: $ python3 Python 3.4.3 (default, Mar 26 2015, 22:03:40) [GCC 4.9.2] on linux Type "help", "copyright", "credits" or "license" for more information. >>> ### 2。 安装几个软件
2021-12-05 18:18:58 10.45MB Python
1
数据跨越10年以上,包括截至2012年10月的568,454条评论。内容包括产品、用户信息、评分以及纯文本评论。
2021-12-02 15:12:26 116.45MB NLP 自然语言处理
1