俄语中的推文情感分析:使用带有Word2Vec嵌入的卷积神经网络(CNN),对俄语中的推文进行情感分析
2021-10-19 17:42:54 449KB nlp machine-learning tweets sentiment-analysis
1
课堂项目 一个包含数据科学本科专业课作业的项目文件夹目前包括的课程有 一,操作系统 (四个项目) 【一个简易的shell&三个修改minix实现内存管理和I / O子系统(ram盘管理)&chrt调用的相关修改】 二,计算机网络 (Java多线程&Java RPI&最终项目) 三,专业英语 (1.蘑菇二分类BP神经网络(训练30次准确率达到100%) (2.基于PHP的小型网址文件夹(支持增删改查等基本操作)) 四,概率论 卷积图像平滑模拟poker计算同花顺概率等 五,数据科学的数学基础 课程python程序(图像压缩欧式距离旋转图片谱图聚类LU分解SVD分解等) 六,计算机系统与云计算 CMU中的slab 七,数据库 寻宝小游戏(postgresql版&mongodb版) 八,算法 1.图片PCA压缩2.基于爬山算法的抽取式文档摘要 九,统计 1.蒙特卡洛求样本偏度峰度度2.区间估计3
2021-10-17 09:53:55 58.16MB 系统开源
1
每个毫升医生的第一个入门项目 此示例是一个基本的朴素贝叶斯应用程序,twitter的数据示例被标记为负数和正数
2021-10-08 13:27:23 113KB Python
1
带有逻辑回归的情感分析:使用逻辑回归的情感分析
2021-09-29 20:58:24 3.93MB JupyterNotebook
1
推文情感分析 更新(2018年9月21日):我没有积极维护该存储库。 这项工作是针对课程项目完成的,由于我不拥有版权,因此无法发布数据集。 但是,可以轻松修改此存储库中的所有内容以与其他数据集一起使用。 我建议阅读该的,该可在docs/找到。 数据集信息 我们使用和比较各种不同的方法来对推文(二进制分类问题)进行情感分析。 训练数据集应该是tweet_id,sentiment,tweet类型的csv文件tweet_id,sentiment,tweet其中tweet_id是标识该tweet的唯一整数, sentiment是1 (正)或0 (负), tweet是括在""的tweet 。 类似地,测试数据集是tweet_id,tweet类型的csv文件。 请注意,不需要csv标头,应将其从训练和测试数据集中删除。 要求 该项目有一些一般的图书馆要求,而某些则是针对个别方法的。 一般要求如下。 numpy scikit-learn scipy nltk 某些方法特有的库要求是: 带TensorFlow后端的keras ,用于Logistic回归,MLP,RNN(LSTM)和CNN
2021-09-17 16:51:24 869KB python machine-learning sentiment-analysis keras
1
使用Amazon评论进行情感分析 概述 使用Jure Leskovec在18年中收集集,我们创建了一个情感字典,其中包含97,436个唯一单词,它们对应于零中心浮点情感得分。 过程 我们首先对语料库中的数据进行预处理,以删除多余的信息。 我们仅使用评论文本和每个评论的星级评分。 经过预处理后,我们使用MapReduce计算每个星级(从1到5)中每个单词的频率。获得每个单词的频率后,我们编写了一种情感算法来计算每个单词的情感分数。 结果 正面的话 单词 情感分数 好的 0.152603809091 伟大的 3.78021467713 惊人的 6.8840020218 惊人 6.54080771437 完美的 5.78771983374 非同凡响 5.72747983897 精彩的 6.05087919002 最好的 3.2653374328 否定词 单词 情感分数 坏的 -5.
2021-08-18 00:25:22 1.21MB Python
1
情感分析
2021-06-19 09:53:47 7.32MB
1
基于BERT的多语言文本情感分析 介绍 社交媒体广泛用于现代人的交流中,推特在英语国家中广泛用于表达情感。 微博在中国被广泛用作同一工具。 他们两个都通过几段文字表达了情感。 有必要设计一种可以对多种语言进行情感分类的系统。 对文本进行情感分类的困难如下。 首先,具有讽刺意味的是,例如交通警察因未付停车费而将他的驾照吊销了。 其次,在与域相关的问题中,例如,我的计算机的冷却系统声音非常大,这是负面的。 可以肯定地说我家的声音很大。 第三,网络流行词也将影响情绪分析,意义在标记化后将完全改变。 为了避免副作用,必须添加人工干预。 第四,文本相对简短,有时会有所遗漏,所有这些都会导致歧义或参考错误。 传统的将统计和规则结合起来的方法不能很好地解决这些难题。 深度学习强大的特征提取能力可以很好地解决这些问题。 Google在2018年10月提出了Bert模型[1]。 该模型不仅集成了LSTM
2021-05-13 20:15:44 9.26MB Python
1
亚马逊评论情绪分析 创建该项目的目的是对亚马逊评论进行详尽的分析,无论是正面的,负面的还是中立的。 这是在NLP和机器学习的帮助下实现的。 希望你喜欢! !!!!
2021-05-13 12:45:07 4.14MB JupyterNotebook
1
TextCNN Pytorch实现中文文本分类 论文 参考 依赖项 python3.5 pytorch == 1.0.0 torchtext == 0.3.1 jieba == 0.39 词向量 (这里用的是Zhihu_QA知乎问答训练出来的单词Word2vec) 用法 python3 main.py -h 训练 python3 main.py 准确率 CNN-rand随机初始化嵌入 python main.py Batch[1800] - loss: 0.009499 acc: 100.0000%(128/128) Evaluation - loss: 0.0000
1