先决条件: nltk(TweetTokenizer) 凯拉斯张量流麻木科学的gensim(如果您使用的是word2vec) itertools 克隆存储库: git clone :AniSkywalker / SarcasmDetection.git cd SarcasmDetection / src / 您可以在以下链接中找到经过训练的模型文件 在/ resource / text_model / weights /中下载经过训练的模型 运行脚本: python sarcasm_detection_model_CNN_LSTM_DNN.py 如果要使用自己的数据训练模型,可以将“训练,开发
2023-03-20 21:21:46 3.17MB twitter keras cnn lstm
1
讽刺计划 在Twitter数据集中检测讽刺
2022-03-07 15:30:28 1.9MB JupyterNotebook
1
自动刮伤检测 twitter数据集(Ghosh)和reddit注释数据集(Khodak)中的讽刺检测该项目旨在对twitter数据和reddit注释数据进行讽刺分类。 项目中使用了两个数据集 Twitter数据集(Ghosh) Reddit评论数据集(Khodak) 资料夹 Twitter_dataset_Ghosh i)代码-包含3个notbook .ipynb文件ii)资源-包含所有原始数据和预处理数据以及处于中间状态的输出 Reddit_dataset_Khodak i)代码-包含3个notbook .ipynb文件ii)资源-包含所有原始数据和预处理数据以及处于中间状态的输出 运行项目的依赖项 情感力量工具 lt 凯拉斯 张量流 麻木 科学的 Gensim 斯克莱恩 海生的 matplotlib 大熊猫 泡菜 Ghosh数据集的流程 原始数据已使用twitter_pre
2022-03-07 15:29:16 3.96MB
1
讽刺检测 讽刺是口头讽刺的一种形式,旨在表达蔑视或嘲笑。 嘲讽依靠说话者和听众之间的共同知识,需要机智才能理解和产生机智。 在日常互动中,我们使用手势和模拟,语调和韵律来暗示讽刺意向。 由于我们无法获得此类副语言提示,因此检测书面文本中的讽刺是一项艰巨的任务。 我研究了多种方法来检测推文中的讽刺,这些方法使用传统的机器学习(离散特征上的SVM和Logistic回归器)和深度学习模型(CNN,LSTM,GRU,双向LSTM和基于注意力的LSTM)进行评估,并在4不同的Twitter数据集( 详细信息)。 该研究项目的完成是部分满足了曼彻斯特大学计算机科学理学学士学位的要求,并且在我的导师和导
1
讽刺数据集 在新闻头条中检测讽刺。 有关整个代码,请参考文件。 数据集链接。 使用的框架: 使用TensorFlow v2.2.0训练的模型 使用的模型架构: model.summary() Model: "sequential" _________________________________________________________________ Layer (type) Output Shape Param # ================================================================= embedding (Embedding) (None, 32, 32) 320000 _________________
2021-10-10 03:03:46 8.57MB JupyterNotebook
1
Kaggle 训练数据,标题讽刺数据集
2021-08-25 09:02:41 1.59MB kaggle 数据 训练 sarcasm
1
Fracking Sarcasm using Neural Network
2021-08-04 15:05:23 464KB 神经网络
Fracking Sarcasm using Neural Network Aniruddha Ghosh
2021-04-03 14:12:17 527KB 神经网络 NeuralNetwork