上传者: 42135773
|
上传时间: 2022-03-07 15:29:16
|
文件大小: 3.96MB
|
文件类型: -
自动刮伤检测
twitter数据集(Ghosh)和reddit注释数据集(Khodak)中的讽刺检测该项目旨在对twitter数据和reddit注释数据进行讽刺分类。
项目中使用了两个数据集
Twitter数据集(Ghosh)
Reddit评论数据集(Khodak)
资料夹
Twitter_dataset_Ghosh i)代码-包含3个notbook .ipynb文件ii)资源-包含所有原始数据和预处理数据以及处于中间状态的输出
Reddit_dataset_Khodak i)代码-包含3个notbook .ipynb文件ii)资源-包含所有原始数据和预处理数据以及处于中间状态的输出
运行项目的依赖项
情感力量工具
lt
凯拉斯
张量流
麻木
科学的
Gensim
斯克莱恩
海生的
matplotlib
大熊猫
泡菜
Ghosh数据集的流程
原始数据已使用twitter_pre