亚马逊美食评论
Amazon Fine Food Reviews数据集包含568,454条亚马逊用户截至2012年10月的食品评论。
该分析的目的是建立一个预测模型,在此模型中,我们将能够预测推荐是肯定的还是否定的。 在此分析中,我们将不关注分数,而仅关注建议的积极/消极情绪。
涉及程序
该项目是关于文本数据使用的情感分析
nltk库,其中包括PorterStemmer()和word_tokenize(),可将非结构化文本数据更改为结构化文本
使用countvectorizer(将文本文档的集合转换为令牌计数矩阵),TfidfTransformer(以缩小在给定语料库中频繁出现的令牌的影响,因此,从经验上讲,其信息量少于一小部分的功能)来自sklearn库的训练语料库以进行特征提取
朴素的贝叶斯(MultinomialNB,BernoulliNB)
逻辑回归
使用roc曲线,confc
1