包括手机、口罩、衣服、酒店、零食等五个类别的数据集,其中好、中、坏评各25000条。
2021-05-08 13:07:32 2.65MB NLP 商品文本分类 情感分析
1
该项目主要分为两个部分,一部分为网络爬虫,另一部分为文本情感分析。网络爬虫主要爬取了京东以及淘宝的评论数据,爬取京东评论采用了selenium,淘宝的话反爬虫措施确实比较到位,目前只能根据已有的评论链接进行爬取。文本情感分析采用了情感词典和SnowNLP两种方式,当然SnowNLP的准确率和召回率较高。最后使用tkinter做图形界面将二者的逻辑串联起来,即用户输入一个京东商品的链接,软件解析链接并爬取评论,将评论显示在表格中,并通过词云展示给用户;同时,SnowNLP分析所有评论,将好评及差评数目统计下来。
2021-04-23 17:04:25 14.78MB 爬虫
2021-04-23 00:03:35 1.8MB 数据集
1
为提高对虚假评论的识别精度并对评论数据的有效性进行准确预测,提出一种面向在线产品数据的有效性建模与测量方法。通过结合基于核主成分的特征提取方法和最小二乘支持向量机对在线产品的虚假评论进行识别,基于排序Logit构建回归模型对量化的评论数据进行有效性判别预测。实验结果表明,该方法在虚假评论识别和数据有效性分析方面效果良好,可以为消费者提供更为精确的消费参考、为商业机构提供更具辨识意义的评论数据,具有良好的应用价值。
1
数据是从某电商平台上爬取下来的评论数据。人工对数据进行标记,分为两个类:分别为正面和负面。
2021-04-10 18:06:56 927KB 评论数据集
1
适合数据分析初学者进行简单的文本分类训练和文本情感分析。
2021-03-31 21:40:45 13.3MB 自然语言处理
1
用Python做数据商品情感分析(商品评论数据情感分析)-附件资源
2021-03-31 20:28:27 106B
1
个人使用八爪鱼爬取的微博评论内容,来自2021年1月6日的一条微博,仅分享给大家做科研使用
1
批量爬取股票评论文本数据,包含大量的情感数据,以共分析
2021-03-12 12:12:40 71KB 爬虫 Scrapy python
豆瓣影评数据,21000多条,包括movie_name, user_name, score, comment, date等字段,只需简单处理就可使用。
2021-03-08 13:06:37 5.59MB nlp 情感分析 豆瓣影评
1