该数据集包括了四个领域的中文评论:笔记本电脑、汽车、相机和手机,评论属于 二分类 任务及正面或负面。可被用作于 自然语言处理 中情感分类任务
2021-03-30 21:17:54 106KB 情感分析 自然语言处理 nlp 分类算法
1
Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点均有细粒度的情感注解。 该数据集由斯坦福大学的 NLP 组发布,其中句子和短语共计 239232 条,相较于忽略单词顺序的大多数情绪预测系统,这套深度学习模型建立了基于句子结构 的完整表示。它可根据单词组成的短语判断情绪。 该数据集由斯坦福大学自然语言处理 组于 2013 年发布,相关论文有《Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank》。
1
基于pytorch的RNN双向LSTM情感分析源码,pycharm运行,数据集下载地址http://ai.stanford.edu/~amaas/data/sentiment/,准确率85,注释非常全,适合入门学习
2021-03-29 09:00:15 16.75MB 情感分析 pytorch rnn lstm
1
Deep_Learning_for_Aspect-Based_Sentiment_Analysis_A_Comparative_Review Hai Ha Do
2021-03-19 15:15:02 4.92MB DeepLearning Sentiment Analysis Review
Twitter的股票情绪 将GME Twitter情绪置于GME股票价格之上
2021-03-13 16:07:36 4.07MB R
1
kaggle 的 umich-sentiment-train.txt情感分析数据集
2021-03-09 19:09:27 359KB 机器学习情感分析数据集
1
情感分类 情感分类 情感分类是分析一段文本并预测某人是否不喜欢他们在说的事情的任务。 输入:一段文字 输出:情绪 数据集 我正在使用进行模型训练,它包含两列 前处理 代币化 令牌化是将文本,短语,句子,文档分成较小的“块”或“令牌”的过程 例如: “嘿,好久不见了” 令牌: “嘿”,“有”,“长”,“时间”,“否”,“看到” 通过定位单词边界来创建较小的单位或令牌,单词边界是单词的终点和下一个单词的开头。 排序和填充 排序用于将我们的文本用作神经网络中的输入层 “嘿,那里”,“嘿,那里儿” [['1 2'],['1','2','3']] 进行填充以使向量输入具有相同的大小 [[1,2] [1,2,3] 语料库将具有不同大小的句子,如上面的示例所示。 进行填充以使其大小相同 [[0 1 2] [1 2 3] 模型 该模型架构是使用tf.keras.utils.plot
2021-03-09 19:05:16 4.73MB JupyterNotebook
1
在云上进行情感分析的全面评估 Ashwin Nalwade,陈名喜。 科技栈 应用程序和数据:Python,Flask,Gunicorn,CSS,spaCy,PyTorch,Pandas,HuggingFace。 云:Paperspace的Google Cloud Platform(GCP),IBM Cloud,Gradient Cloud。 容器:Docker [Docker Hub],Kubernetes,Google Kubernetes Engine。 跨平台比较 我们在3个不同的云平台上测试了不同的方法,并通过在GPU上运行时使用探查器来分析训练时间[历时平均值],准确性和内存利用率[峰值]。 GPU详细信息[Colab Pro] Fri Nov 27 20:47:34 2020 +----------------------------------------------
1
自杀情绪分析 使用的算法:准确性(运行代码仅使用准确性测试数据) 逻辑回归 随机森林 支持向量机 纳维·贝叶斯(Navie Bayes)提出的方法论 通过Kaggle网站( 获得的数据集正向推文通过Git中心存储库获得的负向推文正向推文标记为0负向推文标记为1余额数据集创建了5000条积极的推文5000条负面的推文 数据预处理 删除了推文中的URL和标点符号 代币化 抽干-抽干机PorterStemmer 词法分解-使用的词法分解器是WordNetLemmatizier 收集词和词法后,收集唯一的单词(指定代码中使用的函数名称) 使用代码中提到的功能删除停用词删除停用词后,唯一词 删除较少的频率词删除较少的频率词后的字数 特征提取去除频率较低的单词后,通过去除数字来形成新列表2使用了方法 CountVectorizer(定义公式)用于将唯一和频繁的单词转换为矢量 在删除频率较低的单
2021-03-06 20:06:18 1KB
1
线性回归餐厅情感分析 目录表 描述 线性回归机器学习模型可预测评论是肯定的还是否定的。 它以86%的准确度正确预测正确的标签。 技术领域 使用以下项目创建项目: python版本:3.9.1 NumPy库版本:1.20.0 熊猫库版本:1.2.2 数据集 制作数据集后,每个功能都是代表餐厅评论中所使用单词的存在或不存在的分类特征(0、1)。 常见词(例如“ the”,“ a”等)未分类。 每行代表一个点(餐厅评论),每列代表其特征(评论中是否使用单词)。 除了评论是肯定的(1)还是否定的(0),每列都是除包含标签的最后一列之外的单独功能。 设置 下载.py文件,training_dataset,validation_dataset和权重文件。 将它们放在单个文件或项目文件中。 运行代码 将以下内容添加到类文件中: x = logistic_regression("train_d
2021-02-26 12:05:53 4.99MB Python
1