搭建LSTM网络的情感分类网络,加载预训练的word2vec语言模型参数,在IMDB训练数据集上进行模型训练,获得最优分类模型,并在IMDB测试数据集上进行测试,将训练和测试结果进行可视化展示。
2023-02-07 22:42:17 10KB 自然语言处理 pytorch LSTM word2vec
1
Kaggle_Disaster_Tweets 带有灾难性推文的自然语言处理:预测哪些推文与真实灾难有关,哪些不与真实灾难有关任务开始日期:2021.04.04 任务说明:使用火车数据中的信息,构建模型以预测某条推文是否与真实灾害有关 火车数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 7552/61 1% '地点' 发推文的位置 5080/2533 33% '文本' 推文的文字 7613/0 0% '目标' 这条推文是否是一场真正的灾难(标签) 7613/0 0% 测试数据集说明: 列 描述 有效/缺失 遗失率 'ID ' 每条推文的唯一标识符(推文编号) 7613/0 0% '关键词' 推文中的特定关键字 3237/26 1% '地点' 发
2023-02-04 19:10:35 2KB Python
1
Conll-2003 数据集:第一列是单词,第二列是词性,第三列是语法,第四列是实体标签。在NER任务中,只关心一和四列。
2023-01-31 16:37:08 729KB 自然语言处理 人工智能 nlp
1
整书PDF+代码
2023-01-24 11:20:18 390.04MB python 自然语言处理
1
适用于中文中长文本分类 原始数据集和已经划分的数据集已给出 划分的数据集经过数据预处理,删除了其中的重复文本,以及文本长度小于50的句子,最终构造的平衡语料 训练集 5800 测试集 1000条 验证集1000 (正负评论各站一半)
1
cocoNLP - 中文信息抽取工具包
2023-01-09 12:22:05 560KB 自然语言处理
1
深度学习模型被证明存在脆弱性并容易遭到对抗样本的攻击,但目前对于对抗样本的研究主要集中在计算机视觉领域而忽略了自然语言处理模型的安全问题.
2023-01-09 11:00:49 1.61MB 对抗样本 深度学习
1
NLTK是Python中用于自然语言处理的第三方模块,但处理中文文本具有一定局限性.利用NLTK对中文文本中的信息内容进行抽取与挖掘,采用同语境词提取、双连词搭配提取、概率统计以及篇章分析等方法,得到一个适用于中文文本的NLTK文本内容抽取框架,及其具体的实现方法.经实证分析表明,在抽取结果中可以找到反映文本特点的语料内容,得到抽取结果与文本主题具有较强相关性的结论.
1
自然语言处理——刘洋1、判断题(每题1分,共10道)基本都是一些概念,比如汉语是不是曲折语,知识图谱的节点和边表示什么之类的2、选择题(每题2分,共5道)(1)
2023-01-06 04:00:11 21KB 自然语言处理 知识图谱 机器翻译 cnn
1
这是 ShowMeAI 持续分享的『随书代码』系列,文件是《ML Recipe》的随书代码。 ◉ 简介:原书包含自然语言处理、图像与文字、计算机视觉三个部分,具有相当的专业深度,对于学习者和有一定经验的从业者都是适用的,对于建立深度学习模型并解决实际任务来说,都是有帮助的。 ◉ 目录: Natural language processing / 自然语言处理 - Named entity recognition / 命名实体识别 - Masked language modeling / 掩码语言建模 - Machine translation / 机器翻译 - Causal language modeling / 概率语言建模 Image & Text / 图像与文字 - Image captioning / 看图说话 Computer vision / 计算机视觉 - Image classification / 图像分类 - Image segmentation / 图像分割 - Object detection / 目标检测
1