SOHU基准
搜狐校园算法大赛基线
代码运行环境:
python 3.6
凯拉斯2.2.4
tqdm
界坝
张量流-gpu 1.12.0
整体思路:
采用管道的方式,将这个任务拆为两个子任务,先预测方面,根据方面预测情感极性(ABSA),这两个子任务都使用深度学习模型解决
方面预测采用指针标注的方式解决,标注aspect的头和尾,思路参考苏神在百度信息撷取的基准
根据aspect的情感分析是一个多分类问题,首先根据分隔符将文本拆分成多段,然后拆分aspect出现过的文本,再进行三分类
代码框架:
基线/:官方的基线
数据/:比赛的原始数据
log /:日志输出文件
ner /:训练ner模型的相关数据
output /:最终结果文件
sentiment_data /:训练情感分类模型的相关数据
w2v /:词向量
analysis.py:数据分析
ner.py:ner模型
ner
2021-05-25 21:27:38
22KB
Python
1