使用RNN循环神经网络实现对爬取的京东评论信息进行情感分析 其中包括源代码、数据集、停用词等
2023-03-22 12:02:45 3.41MB 深度学习 NLP 循环神经网络 文本分类
1
基于分词与BP网络的文本分类 首先下载整个文件,BP文本分类-语义特征提取.rar主要存放了相关的数据集 代码主要包括: 1.特征提取 首先对文本信息进行分词处理,采用基于字符串匹配的方法: 依次截取一到多个词,并与字典库进行匹配。如二狗,如果匹配到字典中有这个词,则将其分为一个词;发现字典中没有与之匹配的,则说明这个不是一个词语,进行顺序操作, 2.得到分词后的文本之后,就是转换成数字编码,因此电脑没办法识别汉字。这一部分叫特征表示,即用数字的方式表示中文文本,采用的方法是基于词带模型的特征表示 3.通过2我们将文本表示成了数字,但是这样的表示通常都是稀疏的,为此我们利用降维方法,消除掉这些冗余特征。 4. 文本分类,采用的就是bp网络(1)如pca的降维数,维数过高,包含冗余数据,过低又会删除掉重要信息。(2)bp网络结构的调整,如隐含层节点数,学习率等
2023-03-06 10:05:56 3.48MB BP神经网络 文本分类器 MATLAB
1
基于网络文本分析的旅游形象感知研究.doc
2022-05-31 17:00:14 538KB 互联网
针对社交网络数据的文本情感分析,目前常用的研究方法主要是基于传统机器学习算法,根据手工标注好的情感词典,对文本信息使用朴素贝叶斯、支持向量机、最大熵方法等机器学习算法进行情感分析。为了避免对手工方式建立的情感词典的依赖,减少机器学习过程中的人工干预,提出基于卷积神经网络和注意力模型相结合的方法进行文本情感分析。实验表明,根据准确率、召回率和F1测度等衡量指标,提出的方法较传统的机器学习方法和单纯的卷积神经网络方法有明显的提高。
1
aclIMDB_v1:大型电影评论数据集(来自斯坦福大学),其中包含50,000个电影评论(50%为负,50%为正)。该集合被划分为训练和验证数据集(每个数据集有25000个电影评论,具有相同数量的正面和负面评论),还包括了5000条未标注的影评。其中有已处理好的单词包 rt-polaritydata:也是IDMB整理的数据集,较上一个数据集小,且已经大致地处理过了,标点符号分隔开,全部小写化。包含10,662个电影评论(半正,半负)。此文件中的每一行都是一则短短的电影评论。
2022-01-08 18:01:31 80.71MB IMDB影评 神经网络 文本分类 情感计算
1
传统文本分类使用word embedding作为文档表示,忽略词在当前上下文的含义,潜在地认为相同词在不同文本中含义相同。针对此问题提出一种词义消歧的卷积神经网络文本分类模型——WSDCNN(word sense disambiguation convolutional neural network)。使用双向长短时记忆网络(BLSTM)建模上下文,得到词义消歧后的文档特征图;利用卷积神经网络(CNN)进一步提取对文本分类最重要的特征。在四个数据集上进行对比实验,结果表明,所提出方法在两个数据集,特别是文档级数据集上优于先前最好的方法,在另外两个数据集上得到与此前最好方法相当的结果。
1
基于网络文本分析和问卷调查的丹东旅游形象感知思考范文.docx
2021-10-14 14:07:25 169KB 网络
基于网络文本的甘肃旅游感知形象与投射形象对比范文研究.docx
2021-10-14 14:07:25 146KB 网络
主要介绍了Python使用循环神经网络解决文本分类问题的方法,结合实例形式详细分析了Python神经网络相关概念、原理及解决文本分类具体操作技巧,需要的朋友可以参考下
2021-06-24 18:29:16 587KB Python 循环神经网络 文本分类问题
1
网络文本采集与分类系统的设计与实现_余菁雯.caj
2021-03-09 15:00:06 2.37MB windows 10
1