基于机器学习的商品评论情感分析——毕业设计项目.zip从淘宝爬取评论 使用Selenium模拟真实登录行为,并爬取数据。 数据清理 如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。 分词 使用jieba精确模式进行分词,构造词典 将词汇向量化 创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引 分类模型对比 SVM vs LSTM 基于机器学习的商品评论情感分析——毕业设计项目.zip从淘宝爬取评论 使用Selenium模拟真实登录行为,并爬取数据。 数据清理 如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。 分词 使用jieba精确模式进行分词,构造词典 将词汇向量化 创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引 分类模型对比 SVM vs LSTM 基于机器学习的商品评论情感分析——毕业设计项目.zip从淘宝爬取评论 使用Selenium模拟真实登录行为,并爬取数据。 数据清理 如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。 分词 使用jieba精确