基于餐饮评论数据的情感分析(主要涉及到短文分类,分别使用朴素贝叶斯、支持向量机、Xgboost 进行情感值的二分类)
本文主要通过情感分析来挖掘评论中有价值的信息。
获取所研究数据,即大众点评餐饮评论数据,通过分词去除停用词、词性标注等操作进行数据预处理,然后通过机器学习的方法来分析餐饮评论的情感极性,来进一步挖掘评论中有价值的信息。
使用python的结巴分词工具对中文文本进行分词。可用TF-IDF、词袋方法提取文本数据的特征。然后使用机器学习的方法进行文本分类,可以运用朴素贝叶斯(NB)、支持向量机(SVM)、随机森林等算法。查询了资料,考虑了速度、容错性、变量筛选能力、共性容忍度等因素,初步设想选用SVM算法。
===》SVM算法优于NB 优于随机森林
2021-07-02 20:02:33
10.92MB
情感分析