为构建国际关系领域的情感词典,数据集(data文件)选取国内各大媒体型智库中国际关系领域文章,另选取SO-PMI种子词输入为30个(积极词消极词各15个),通过python实现得到积极词和消极词情感词表各一张,输出内容包括词汇、情感值、词长度、词性。
2022-06-23 18:13:18 1.61MB python 媒体 文档资料 自然语言处理
1
基于SO-PMI算法的情感极性判别代码,有注释容易理解。针对2元词组共现频率为0的情况,参照论文设置了goodturing平滑和laplace平滑方法。论文可以自己去知网搜索。运行速度慢,建议训练数据不要超过80000条。
1