本项目基于 weibo_senti_100k.csv 数据集,分别使用朴素贝叶斯、逻辑回归、LSTM、CNN、BERT等模型进行了实验,其中涉及的词向量表示方式包括one-hot、Bag of Words、TF-IDF、Word2Vec、Glove等。对于Word2Vec和Glove词向量的构建过程,本项目也提供了相关代码。项目中模型的训练运行脚本为train.sh,如bert_train.sh,模型的测试运行脚本为test.sh,如bert_test.sh。此外,本项目也会给出如何将训练好的BERT模型以服务的形式进行部署,以满足商业应用中的实时性需求。针对具体模型的使用,请读者查看*_README.md文件。希望通过本项目的学习,读者能够对情感分析中常用的模型技术有进一步的理解。
1