情感分析目标:情感分析是一种机器学习工具,可以分析文本的极性(正,中性,负面)。通过训练带有文本情感示例的机器学习工具,机器可以自动学习如何在没有人工输入的情况下检测情感。 项目结构:步骤a-导入库和数据。 (存储库包含该项目中使用的数据集)步骤b-文本规范化步骤c-归类化步骤d-数据预处理步骤e-模型构建。 我使用机器学习算法来构建和训练模型:线性回归,决策树分类器,随机森林分类器,K邻居分类器和支持向量机(SVM) 一些项目的图像:
2021-09-26 08:21:45 17.86MB JupyterNotebook
1
使用BERT的细粒度情感分类 此存储库包含用于获取的结果的代码。 用法 可以使用run.py运行各种配置的实验。 首先,安装python软件包(最好在一个干净的virtualenv中): pip install -r requirements.txt Usage: run.py [OPTIONS] Train BERT sentiment classifier. Options: -c, --bert-config TEXT Pretrained BERT configuration -b, --binary Use binary labels, ignore neutrals -r, --root Use only root nodes of SST -s, --save
1
推文情感分析 更新(2018年9月21日):我没有积极维护该存储库。 这项工作是针对课程项目完成的,由于我不拥有版权,因此无法发布数据集。 但是,可以轻松修改此存储库中的所有内容以与其他数据集一起使用。 我建议阅读该的,该可在docs/找到。 数据集信息 我们使用和比较各种不同的方法来对推文(二进制分类问题)进行情感分析。 训练数据集应该是tweet_id,sentiment,tweet类型的csv文件tweet_id,sentiment,tweet其中tweet_id是标识该tweet的唯一整数, sentiment是1 (正)或0 (负), tweet是括在""的tweet 。 类似地,测试数据集是tweet_id,tweet类型的csv文件。 请注意,不需要csv标头,应将其从训练和测试数据集中删除。 要求 该项目有一些一般的图书馆要求,而某些则是针对个别方法的。 一般要求如下。 numpy scikit-learn scipy nltk 某些方法特有的库要求是: 带TensorFlow后端的keras ,用于Logistic回归,MLP,RNN(LSTM)和CNN
2021-09-17 16:51:24 869KB python machine-learning sentiment-analysis keras
1
基于方面的情感分析 基于方面的情感分析任务专注于识别方面类别和文本中的情绪(正面,负面,中性)分类。 基于方面的情感分析的目的是确定针对特定方面表达的情感极性。 该系统基于使用支持向量机(SVM)的监督学习。 多标签svc分类器用于将笔记本电脑评论分为20个方面类别,还可以将评论分为正面,负面或中性。 对于每种情感,都使用多标签svc分类器。 系统的性能也与其他分类器进行了比较。 数据集 所需的库 Scikit学习 纳尔特克 大熊猫 麻木 PS:这是加德满都大学计算机科学与工程系最后一年的一个为期2个月的速成课程(NLP)的微型项目。
2021-09-16 18:19:39 535KB 系统开源
1
情感分析 :rocket: 该网站在Heroku准确率= 93% 我接受了亚马逊原始评论来创建情绪分析。.我使用的数据集是
2021-09-16 17:24:15 1.5MB Python
1
Flask-NLP-情感分析 简单的基于Textblob和NLP的命令情感分析器Web应用程序。 使用的模块 模块 用例 烧瓶 Web应用程序 flask_bootstrap 提供CSS 文本框 处理单词 时间 记录执行时间 随机的 随机生成东西 正在运行的项目 在Windows上安装 在Windows中设置Flask应用程序 set FLASK_APP=app.py set FLASK_DEBUG=1 在Unix上安装 在Unix中设置flask应用程序 export FLASK_APP=app.py export FLASK_DEBUG=1 运行应用程序 设置flask应用程序后,要运行应用程序,请使用以下命令 flask run --port=8080 --port标志是可选的 谢谢你! DHRUV PRAJAPATI
2021-09-14 14:44:45 4KB HTML
1
美国会计准则学会 方面类别情感分析的论文,模型和数据集,包含两个细粒度的子任务:方面类别检测(ACD)和方面类别情感分类(ACSC)。 要求 python 3.6 pytorch 1.3.0 艾伦纸0.9.0 用法 支持的数据集 SemEval-2014-Task-4-LAPT SemEval-2014-Task-4-REST SemEval-2014-Task-4-REST-DevSplits SemEval-2014-Task-4-REST-Hard SemEval-141516-大型REST-HARD SemEval-2015-Task-12-LAPT SemEval-2015-Task-12-REST SemEval-2015-Task-12-HOTEL SemEval-2016-Task-5-CH-CAME-SB1 SemEval-2016-Task-5-C
2021-09-03 20:48:46 23.33MB pytorch acd aspect-based-sentiment-analysis acsc
1
Doc2Vec文本分类 文本分类模型,该模型使用gensim Doc2Vec生成段落嵌入,并使用scikit-learn Logistic回归进行分类。 数据集 25,000个IMDB电影评论,特别选择用于情感分析。 评论的情绪是二进制的(1表示肯定,0表示否定)。 与以下出版物相关联地收集了此源数据集: Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, and Christopher Potts. (2011). "Learning Word Vectors for Sentiment An
1
细粒度情感分类 此仓库显示了对各种NLP方法的比较和讨论,这些方法可以在(SST-5)数据集上执行5级情感分类。 目标是使用多个基于规则,基于线性和神经网络的分类器来预测此数据集上的类,并查看它们之间的区别。 当前已实现以下分类器: TextBlob :基于规则,使用库中的内部polarity度量。 Vader :基于规则,使用库中的compound极性分数。 Logistic回归:在将词汇表转换为特征向量并考虑使用TF-IDF的词频影响后,在scikit-learn中训练简单的logistic回归模型。 SVM :在将词汇表转换为特征向量并使用TF-IDF考虑词频的影响后,在sci
2021-08-19 22:24:07 1.55MB nlp sentiment-analysis transformers flair
1
ABSA-PyTorch 基于方面的情感分析,PyTorch实现。 基于方面的情感分析,使用PyTorch实现。 需求 火炬> = 0.4.0 numpy的> = 1.13.3 斯克莱恩 python 3.6 / 3.7 变形金刚 要安装需求,请运行pip install -r requirements.txt 。 对于非基于BERT的模型,需要,请参阅了解更多详细信息。 用法 训练 python train.py --model_name bert_spc --dataset restaurant 所有实现的模型都列在。 有关更多训练参数,请参见 。 请参阅以获取k倍交叉验证支持。 推理 有关基于非BERT的模型和基于BERT的模型,请参考 。 提示 对于非基于BERT的模型,训练过程不是很稳定。 基于BERT的模型对小数据集上的超参数(尤其是学习率)更敏感,请参阅。 为了释放BERT的真正功能,必须对特定任务进行微调。 评论/调查 邱锡鹏等。 “自然语言处理的预训练模型:调查。” arXiv预印本arXiv:2003.08271(2020)。 张磊,王帅和刘
1