关系分类是自然语言处理领域的一项重要任务,能够为知识图谱的构建、问答系统和信息检索等提供技术支持.与传统关系分类方法相比较,基于神经网络和注意力机制的关系分类模型在各种关系分类任务中都获得了更出色的表现.以往的模型大多采用单层注意力机制,特征表达相对单一.因此本文在已有研究基础上,引入多头注意力机制(Multi-head attention),旨在让模型从不同表示空间上获取关于句子更多层面的信息,提高模型的特征表达能力.同时在现有的词向量和位置向量作为网络输入的基础上,进一步引入依存句法特征和相对核心谓词依赖特征,其中依存句法特征包括当前词的依存关系值和所依赖的父节点位置,从而使模型进一步获取更多的文本句法信息.在SemEval-2010任务8数据集上的实验结果证明,该方法相较之前的深度学习模型,性能有进一步提高.
2023-02-27 17:05:50 981KB 关系分类 Bi-LSTM 句法特征 self-attention
1
BI-LSTM-CRF用于方面提取-情感提取 数据->通过BDCI 2017基于主题的文本情感分析的训练数据修改的数据集: ://www.datafountain.cn/#/competitions/268/intro,最后访问时间2018/5/13 train.csv->培训文件大小:13652 dev.csv->开发文件大小:2000 test.csv->测试文件大小:2000 pre_data.py->生成用于随机嵌入和label2tag的字典 model.py-> BI-LSTM-CRF / BI-LSTM / LSTM-CRF / LSTM-CRF的实现 main.py->主文件 conlleval_rev.pl-> SINHAN NER任务的评估手稿 conlleval.py->此任务的评估指标,可用于序列标记任务
2023-02-17 10:12:52 1.02MB Python
1
一层双向lstm,,用平安银行做的股票预测。注:以20天的数据为一组,预测第21天的股票值,反向计算中只用到了第20天的隐藏层输出,其他的并未用到,体现不出双向lstm的结构性能。所以弃用,换用情感分析数据集从新做。
2022-04-13 17:06:41 372KB lstm 人工智能 rnn 深度学习
1
当前基于油中溶解气体分析(DGA)的变压器故障诊断方法往往仅考虑单一时刻数据点,容错性差,难以充分挖掘在线监测数据的时序信息。提出一种考虑变压器油特征参量序列间复杂关系的基于双向长短时记忆(Bi-LSTM)网络的变压器故障诊断方法。首先构建了变压器油特征参量序列,基于序列数据构建了Bi-LSTM变压器故障诊断模型。工程实际中不同变压器油特征参量序列长短不一,需通过排序、分组填充对模型输入进行重构改进,然后对超参数进行优化。基于同一自建数据库对比所提方法与其他方法,结果表明:经过数据重构后所提方法的准确率可达91.9 %;当特征指标数量减少约2/3时,所提方法的准确率仅下降约1%,而其他方法的准确率平均下降约6 %;当采样数据存在10%的随机错误时,所提方法诊断准确率仅下降2%~6 %,且通过改变隐藏层的数量可得到改善。
1
针对中文文本自动校对提出了一种新的基于Seq2Seq和Bi-LSTM结合的深度学习模型。与传统的基于规则和概率统计的方法不同,基于Seq2Seq基础结构改进,加入了Bi-LSTM单元和注意力机制,实现了一个中文文本自动校对模型。采用F0.5与GLEU指标评价,通过公开的数据集进行不同模型的对比实验。实验结果表明,新模型能有效地处理长距离的文本错误以及语义错误,Bi-RNN以及注意力机制的加入对中文文本校对模型的性能有显著提升。
2021-11-27 21:00:59 542KB 中文文本校对
1
需要调用的模块及整体Bi-lstm流程 import torch import pandas as pd import numpy as np from tensorflow import keras import torch.nn as nn import torch.nn.functional as F import torch.optim as optim from torch.utils.data import DataLoader from torch.utils.data import TensorDataset import gensim from sklearn.model_s
2021-11-25 19:48:48 54KB c OR tor
1
时间序列异常检测 该存储库包含Sanket Mishra,Varad Kshirsagar,Rohit Dwivedula和Chittaranjan Hota题为“基于注意力的Bi-LSTM用于时间序列数据异常检测”的论文的开源代码。 型号图 * 提议的模型与现有和先前的最新模型的比较 根据平均F分数: 数据集 我们的模型 深度防盗 工作组 AdVec 天际线 NumentaTM 努门塔 KNN CAD HTM Java 人工无异常 0 0 0 0 0 0 0 0 0 人工的异常 0.402 0.156 0.013 0.017 0.043 0.017 0.012 0.003 0.017 realAdExchange 0.214 0.132 0.026 0.018 0.005 0.035 0.040 0.024 0.034
2021-11-17 14:35:03 3.7MB Python
1
nlp_ner 使用Bi-LSTM和crf来进行人名识别,数据集人民日报98年1月标注数据集,训练:验证:测试为3:1:1 数据说明 原数据文件是/data/rmrb199801.txt data_process.py对文件进行了大量的处理 结果 acc:0.99 f1:0.9
2021-11-13 10:03:59 43.54MB Python
1
情感分析分类 先决条件 安装依赖项 pip install -r requirements.txt 安装Spacy英语数据 python -m spacy download en 框架 火炬 数据集 Cornell MR(电影评论)数据集 实施 RNN LSTM 双LSTM LSTM +注意 有线电视新闻网
2021-11-02 09:33:23 6.45MB pytorch lstm rnn bi-lstm
1
BI-LSTM-CRF模型的PyTorch实现。 特征: 与相比,执行了以下改进: 全面支持小批量计算 完全矢量化的实现。 特别是,删除了“得分句”算法中的所有循环,从而极大地提高了训练效果 支持CUDA 用于非常简单的API START / STOP标签会自动添加到CRF中 包含一个内部线性层,该线性层可从要素空间转换为标签空间 专门用于NLP序列标记任务 轻松训练自己的序列标记模型 麻省理工学院执照 安装 依存关系 的Python 3 安装$ pip install bi-lstm-crf 训练 语料库 以指定的准备语料库 也有一个示例语料库 训练 $ python -m bi_lstm_crf corpus_dir --model_dir " model_xxx " 更多 训练曲线 import pandas as pd import matplotlib . pyplot
2021-10-09 14:34:48 16KB nlp crf pytorch ner
1