内含微博评论数据集两个,一个是训练集,一个是测试集。
2021-09-02 17:02:47 506KB 微博
1
基于多路层次聚类的商品评论数据概念分类构建.pdf
2021-08-21 09:37:27 1.78MB 聚类 算法 数据结构 参考文献
对应https://gist.github.com/kunalj101/ad1d9c58d338e20d09ff26bcc06c4235
2021-08-20 01:24:53 4.3MB 数据集
1
使用python爬取音乐网站数据,并将数据存入csv文件中。使用前请务必查看说明文档 #资源达人分享计划#
2021-08-15 22:02:25 40KB python爬虫
1
该资料为酒店的网上评论数据集,分为正负两个数据集,各2000篇。
2021-08-12 09:35:07 1.81MB 评论 语料库
1
这个做的先爬取京东海尔洗衣机评论数据数据,大约爬取了两万条数据。然后在这两万条数据里面先做数据清洗。然后在分词 做词云图。最后根据算法做出情感分析。得出结论。给出建议。总共写了8000字左右
2021-07-18 17:05:47 2.12MB 数据分析 情感分析
1
在线评论数据挖掘视角下的产品改良设计研究.pdf
2021-07-14 11:04:52 1.69MB 数据挖掘 行业数据 数据分析 参考文献
基于谭松波老师的酒店评论数据集的中文文本情感分析,二分类问题 数据集标签有pos和neg,分别2000条txt文本 选择RNN、LSTM和Bi-LSTM作为模型,借助Keras搭建训练 主要工具包版本为TensorFlow 2.0.0、Keras 2.3.1和Python 3.6.2 在测试集上可稳定达到92%的准确率
文档为基于美团、携程、途牛、同城等几个APP上对于海南景区的评价xlsx、sql格式文件,其中包含海南各大景区的评价,内容丰富,适合模型训练、语料归纳、数据分类等训练检测用。下载方便。
2021-07-05 15:01:36 3.48MB 评论数据 海南景区 中文语料 nlp
1
基于餐饮评论数据的情感分析(主要涉及到短文分类,分别使用朴素贝叶斯、支持向量机、Xgboost 进行情感值的二分类) 本文主要通过情感分析来挖掘评论中有价值的信息。 获取所研究数据,即大众点评餐饮评论数据,通过分词去除停用词、词性标注等操作进行数据预处理,然后通过机器学习的方法来分析餐饮评论的情感极性,来进一步挖掘评论中有价值的信息。 使用python的结巴分词工具对中文文本进行分词。可用TF-IDF、词袋方法提取文本数据的特征。然后使用机器学习的方法进行文本分类,可以运用朴素贝叶斯(NB)、支持向量机(SVM)、随机森林等算法。查询了资料,考虑了速度、容错性、变量筛选能力、共性容忍度等因素,初步设想选用SVM算法。 ===》SVM算法优于NB 优于随机森林
2021-07-02 20:02:33 10.92MB 情感分析