为解决旅游文本在特征表示时的一词多义问题, 针对旅游游记文本景点实体识别中景点别名的问题, 研究了一种融合语言模型的中文景点实体识别模型. 首先使用BERT语言模型进行文本特征提取获取字粒度向量矩阵, BiLSTM用于上下文信息的提取, 同时结合CRF模型提取全局最优序列, 最终得到景点命名实体. 实验表明, 提出的模型性能提升显著, 在实际旅游领域内景点识别的测试中, 与以往研究者方法比较下准确率, 召回率分别提升了8.33%, 1.71%.
1
NER-Sequence-labeling--Textcnn-bilstm-crf-pytorch pytorch用Textcnn-bilstm-crf模型实现命名实体识别 数据处理 数据处理文件是'data_preprocess.py' 模型和训练过程 模型和训练过程都在同一个文件中‘cnn-bilistm-crf.py’ 预测 预测文件为‘predict.py’   数据 数据存在data文件夹中
2021-11-05 14:04:29 16KB Python
1
双向LSTM进行命名实体识别NER
2021-11-04 23:00:21 39.47MB 双向LSTM BiLSTM
1
无人机实体关系数据,参加了CCKS2021无人机图谱构建任务的数据,自己标注的,数据率极高,实体关系,实体属性
2021-11-04 13:09:53 220KB NLP 命名实体识别 标注数据 无人机
1
自然语言处理工具包。目前支持阿拉伯语,中文,英文,法语,德语,西班牙语,做平行语料的对比非常方便。获得文本的语言注释,包括token和句子边界、语音处理、命名实体、数字和时间值、依赖性分析,java版本
2021-11-04 13:03:12 218.6MB nlp 命名实体 corenlp
医学问答高质量文本收集,可以用作文本生成训练,医学问答场景命名实体识别,
2021-11-01 18:15:00 87.8MB 命名实体识别 高质量文本
1
裁判文书中的命名实体识别是自动化审判的关键一步,如何能够有效的分辨出案件的关键命名实体是本文的研究重点.因此本文针对财产纠纷审判案件,提出了一种基于SVM-BiLSTM-CRF的神经网络模型.首先利用SVM筛选出包含关键命名实体的句子,然后将正确包含此类实体的句子转化为字符级向量作为输入,构建适合财产纠纷裁判文书命名实体识别的BiLSTM-CRF深层神经网络模型.通过构建训练数据进行验证和对比,该模型比其他相关模型表现出更高的召回率和准确率.
2021-10-31 16:58:52 1.1MB 命名实体识别 SVM BiLSTM CRF
1
对Bert模型的Ner任务提供了数据集demo
2021-10-29 15:27:57 954KB Bert Ner 命名实体识别
1
mynlp:一个生产级,高性能,预定,可扩展的中文NLP工具包。(中文分词,平均感知机,fastText,拼音,新词发现,分词纠错,BM25,人名识别,命名实体,自定义词典)
2021-10-26 17:08:50 1.16MB nlp segment pinyin fasttext
1
python NLTK识别字符串中的人名等,命名实体识别-附件资源
2021-10-25 19:26:16 23B
1