只为小站
首页
域名查询
文件下载
登录
基于BIOES模式标注的中文糖尿病命名
实体识别
数据集
这是一个用于中文命名
实体识别
的数据集,采用BIOES模式标注的糖尿病领域的一些非结构化数据。 该数据集对刚入门命名
实体识别
的同学来说,有很大帮助,不仅节省了大量的数据标注时间,而且有利于他们更快速理解命名
实体识别
任务。
2025-05-04 00:33:26
5.51MB
数据集
命名实体识别
1
隐马尔可夫实现序列标记(命名
实体识别
)任务
本案例介绍命名
实体识别
(NER)任务的背景、HMM的原理以及如何将数据应用于序列标记问题,帮助同学们建立坚实的理论基础。 同学们可以通过这个案例学习序列标记问题和HMM的理论基础,从而建立机器学习的核心知识,利用HMM知识去解决实际NER问题,从而加深对理论的理解和应用能力。
2025-04-29 10:51:11
285KB
机器学习
1
基于pytorch+bilstm-crf的中文命名
实体识别
基于pytorch+bilstm_crf的中文命名
实体识别
文件说明 --checkpoints:模型保存的位置 --data:数据位置 --|--cnews:数据集名称 --|--|--raw_data:原始数据存储位置 --|--|--final_data:存储标签、词汇表等 --logs:日志存储位置 --utils:辅助函数存储位置,包含了解码、评价指标、设置随机种子、设置日志等 --config.py:配置文件 --dataset.py:数据转换为pytorch的DataSet --main.py:主运行程序 --main.sh:运行命令 --models.py:模型 --process.py:预处理,主要是处理数据然后转换成DataSet 运行命令 python main.py --data_dir="../data/cnews/final_data/" --log_dir="./logs/" --output_dir="./checkpoints/" --num_tags=33 --seed=123 --gpu_ids="0" --max_seq_len=128 --
2025-03-30 17:14:57
331KB
pytorch
bilstm
1
python毕业设计&课设-基于BERT+BiLSTM+CRF实现中文命名
实体识别
(源码+文档).zip
BERT+BiLSTM+CRF是一种用于中文命名
实体识别
(Named Entity Recognition,简称NER)的模型,结合了BERT模型、双向长短时记忆网络(Bidirectional LSTM)和条件随机场(CRF)。 BERT是一种预训练的深度双向变换器模型,具有强大的自然语言处理能力。它能够学习上下文相关的语义表示,对于NLP任务非常有用。 BiLSTM是一种循环神经网络,能够捕捉上下文之间的依赖关系。通过同时考虑前向和后向上下文,BiLSTM能够更好地理解句子中实体的边界和内部结构。 CRF是一种概率图模型,常用于序列标注任务。它能够基于输入序列和概率分布进行标签推断,使得预测的标签序列具有全局一致性。 在BERT+BiLSTM+CRF模型中,首先使用BERT模型提取句子中的特征表示。然后,将这些特征输入到BiLSTM中,通过双向上下文的学习,得到更丰富的句子表示。最后,使用CRF层对各个词的标签进行推断,并输出最终的
实体识别
结果。 这种模型的优势在于能够充分利用BERT的语义信息和BiLSTM的上下文依赖性,同时通过CRF层对标签进行约束,提高了
实体识别
的
2024-07-02 15:37:12
801KB
python
毕业设计
bert
自然语言处理
自然语言处理课程实验:基于LSTM的命名
实体识别
python编写的简单程序,一共只有130多行,但是应付老师绰绰有余:) 实验:基于LSTM的命名
实体识别
数据处理 给每个实体类型进行编号、给每个单词进行编号 文本填充 使用
标识符,将所有序列处理成同样长度 训练流程 给每个输入和其对应编号建立一个张量 构成训练批 输入LSTM单元 输入全连接层 使用sorftmax或其他分类器进行预测 模型构建 pytorch自带LSTM类/其他工具也可以/自己编码也可以
2024-05-08 15:06:16
1.85MB
自然语言处理
pytorch
pytorch
课程资源
1
chatbot_simbert:检索类型的微信聊天机器人问答系统,通过API异步通信,实现在微信上交互,本项目包括模型和工程化部署一体化。包含查天气,知识图谱聊天查询,生成式问答聊天查询,图片识别,多次重复回答等;涉及到命名
实体识别
,相似匹配(bm25,bool检索,simbert等),bert+seq2seq生成,neo4j知识图谱查询等技术
chatbot_simbert 检索类型的微信聊天机器人/问答系统,通过API异步通信,实现在微信上交互,可以查询天气、重复问句识别等情况;本项目包括模型和工程化部署一体化。用到SimBert等模型。 描述 各位可以根据自己的需求部署或修改: 问答库如果是任务型的,就是一个任务型聊天机器人,如果闲聊的问答库,那就是闲聊型聊天机器人; 后续也可以添加意图,用来用意图识别的匹配;也可以添加个知识图谱的API... 总之可以添加的模块很多,扩展性非常强大。 品尝方式(使用说明) 准备: 环境准备:安装requirement中的依赖包 下载模型,并放置在code/1.retrieve_match/3.simbert_match/config路径下: simbert模型: 启动: 1、 启动code/2.API_serve/KG_service.py 2、 启动code/3.wx_project/c
2024-04-07 10:07:55
1.23MB
Python
1
NER命名体识别:文本标注工具Doccano配置方法/命名
实体识别
任务标注方法实例/标注导出与BIO处理/标签处理并完成对齐操作
命名
实体识别
(Named Entity Recognition,NER)是自然语言处理领域的一项关键任务,旨在从文本中识别和分类特定的命名实体,如人名、地名、组织机构名等。NER的目标是标记文本中的实体,并将其归类到预定义的实体类型中。 NER通常使用机器学习和深度学习技术来完成任务。以下是一种常见的NER流程: 数据收集和标注:收集包含命名实体的文本数据,并为每个实体标注相应的标签(实体类型)。 特征提取:从文本数据中提取有用的特征,如词性、词形、上下文等。这些特征将作为输入提供给模型。 模型训练:使用标注好的数据和提取的特征来训练NER模型。常用的模型包括条件随机场(CRF)、循环神经网络(RNN)、注意力机制等。 模型评估和调优:使用评估数据集来评估训练得到的模型性能,并进行调优以提高准确性和召回率。
实体识别
:使用训练好的NER模型对新的文本进行
实体识别
。模型将识别并标记文本中的命名实体,使其易于提取和理解。 NER在许多应用中起着重要作用,例如信息抽取、问答系统、文本摘要、机器翻译等。以帮助自动化处理大量文本数据,并提供有关实体的结构化信息,为后续的分析和应用提供基础。
2024-02-24 12:25:37
121.6MB
1
基于知识图谱的《红楼梦》人物关系可视化及问答系统(含码源):命名
实体识别
、关系识别、LTP简单教学
1) app.py是整个系统的主入口
2) templates文件夹是HTML的页面
|-index.html 欢迎界面
|-search.html 搜索人物关系页面
|-all_relation.html 所有人物关系页面
|-KGQA.html 人物关系问答页面
3) static文件夹存放css和js,是页面的样式和效果的文件
4) raw_data文件夹是存在数据处理后的三元组文件
5) neo_db文件夹是知识图谱构建模块
|-config.py 配置参数
|-create_graph.py 创建知识图谱,图数据库的建立
|-query_graph.py 知识图谱的查询 6) KGQA文件夹是问答系统模块 |-ltp.py 分词、词性标注、命名
实体识别
7) spider文件夹是模块 |- get_*.py 是之前取人物资料的代码,已经产生好ima
2024-01-17 15:33:50
5.71MB
知识图谱
命名实体识别
关系抽取
自然语言处理
NLP-project:自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名
实体识别
,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据
NLP-study 记录做过的NLP任务,包含但不限于文本分类,关系分类,命名
实体识别
,文本摘要,文本生成等,基于tensorflow2.0或者pytorch框架。
2024-01-12 21:57:28
83.48MB
Python
1
GMB(Groningen Meaning Bank)语料
这是GMB语料库的摘录,经过标记,注释和构建,专门用于训练分类器以预测命名实体,例如名称,位置等。 使用GMB(Groningen Meaning Bank)语料库进行命名
实体识别
的带注释语料库,该语料库通过自然语言处理将具有增强和流行特征的实体分类应用于数据集。
2024-01-03 18:36:44
24.85MB
命名实体识别
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
银行笔试 信息科技岗部分真题
quartus II13.0器件库.zip
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
2019年秋招—华为硬件工程师笔试题目.pdf
java-spring-web-外文文献翻译40篇.zip
韦来生《数理统计》课后习题与答案
SSM外文文献和翻译(毕设论文精品).doc
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
校园网规划与设计和pkt文件
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
MTALAB NSGA2算法
超大规模集成电路先进光刻理论与应用.pdf
最新下载
MSK的matlab仿真
C#6.0 语言规范中文版.pdf
imageJ二次开发资料(中文)
imagej 源码
CH341T CH340T原理图.zip
中文停用词库整理.zip
ffmpeg 实时解码DEMO 实时解码H.264码流
基于Usart的串口屏(USART_HMI)驱动.zip
软件测试小论文-银行存取款系统软件测试论文-毕业论文.doc
ArtiosCAD18.0.1_bld2072安装包下载地址.txt
其他资源
SEIR代码新冠肺炎模型.zip
RPi.GPIO-0.6.3.tar
CPS test for Java
Oracle.DataAccess 64位/32位 各版本集合
电梯系统 UML 图
tsmc 0.18um ADS library
HCIA HCIP HCIE全套题库
html游戏网页设计模板下载
混沌蚁群算法 .rar
语法分析
auto.js实现自动化点击红包雨
jspdf.customfonts.rar
前端自定义拖拽可视化工具dome
python-3.8.2-amd64.rar
CWAP.Certified.Wireless.Analysis.Professional.Official.Study.Guide
w3-total-cache插件中文语言包
福建省县级矢量.zip
基于Struts2、hibernate、spring实现的新闻后台管理系统
惠普服务器网卡驱动
VS2015运行库
qpsk的matlab实现
PDF拼版与加角线折线教程
2018研究生数学建模E题答案
覃志豪,单窗算法温度反演
微机接口技术8255A仿真实验(含C代码、电路图)