只为小站
首页
域名查询
文件下载
登录
基于BIOES模式标注的中文糖尿病命名
实体识别
数据集
这是一个用于中文命名
实体识别
的数据集,采用BIOES模式标注的糖尿病领域的一些非结构化数据。 该数据集对刚入门命名
实体识别
的同学来说,有很大帮助,不仅节省了大量的数据标注时间,而且有利于他们更快速理解命名
实体识别
任务。
2025-05-04 00:33:26
5.51MB
数据集
命名实体识别
1
隐马尔可夫实现序列标记(命名
实体识别
)任务
本案例介绍命名
实体识别
(NER)任务的背景、HMM的原理以及如何将数据应用于序列标记问题,帮助同学们建立坚实的理论基础。 同学们可以通过这个案例学习序列标记问题和HMM的理论基础,从而建立机器学习的核心知识,利用HMM知识去解决实际NER问题,从而加深对理论的理解和应用能力。
2025-04-29 10:51:11
285KB
机器学习
1
基于pytorch+bilstm-crf的中文命名
实体识别
基于pytorch+bilstm_crf的中文命名
实体识别
文件说明 --checkpoints:模型保存的位置 --data:数据位置 --|--cnews:数据集名称 --|--|--raw_data:原始数据存储位置 --|--|--final_data:存储标签、词汇表等 --logs:日志存储位置 --utils:辅助函数存储位置,包含了解码、评价指标、设置随机种子、设置日志等 --config.py:配置文件 --dataset.py:数据转换为pytorch的DataSet --main.py:主运行程序 --main.sh:运行命令 --models.py:模型 --process.py:预处理,主要是处理数据然后转换成DataSet 运行命令 python main.py --data_dir="../data/cnews/final_data/" --log_dir="./logs/" --output_dir="./checkpoints/" --num_tags=33 --seed=123 --gpu_ids="0" --max_seq_len=128 --
2025-03-30 17:14:57
331KB
pytorch
bilstm
1
python毕业设计&课设-基于BERT+BiLSTM+CRF实现中文命名
实体识别
(源码+文档).zip
BERT+BiLSTM+CRF是一种用于中文命名
实体识别
(Named Entity Recognition,简称NER)的模型,结合了BERT模型、双向长短时记忆网络(Bidirectional LSTM)和条件随机场(CRF)。 BERT是一种预训练的深度双向变换器模型,具有强大的自然语言处理能力。它能够学习上下文相关的语义表示,对于NLP任务非常有用。 BiLSTM是一种循环神经网络,能够捕捉上下文之间的依赖关系。通过同时考虑前向和后向上下文,BiLSTM能够更好地理解句子中实体的边界和内部结构。 CRF是一种概率图模型,常用于序列标注任务。它能够基于输入序列和概率分布进行标签推断,使得预测的标签序列具有全局一致性。 在BERT+BiLSTM+CRF模型中,首先使用BERT模型提取句子中的特征表示。然后,将这些特征输入到BiLSTM中,通过双向上下文的学习,得到更丰富的句子表示。最后,使用CRF层对各个词的标签进行推断,并输出最终的
实体识别
结果。 这种模型的优势在于能够充分利用BERT的语义信息和BiLSTM的上下文依赖性,同时通过CRF层对标签进行约束,提高了
实体识别
的
2024-07-02 15:37:12
801KB
python
毕业设计
bert
自然语言处理
自然语言处理课程实验:基于LSTM的命名
实体识别
python编写的简单程序,一共只有130多行,但是应付老师绰绰有余:) 实验:基于LSTM的命名
实体识别
数据处理 给每个实体类型进行编号、给每个单词进行编号 文本填充 使用
标识符,将所有序列处理成同样长度 训练流程 给每个输入和其对应编号建立一个张量 构成训练批 输入LSTM单元 输入全连接层 使用sorftmax或其他分类器进行预测 模型构建 pytorch自带LSTM类/其他工具也可以/自己编码也可以
2024-05-08 15:06:16
1.85MB
自然语言处理
pytorch
pytorch
课程资源
1
chatbot_simbert:检索类型的微信聊天机器人问答系统,通过API异步通信,实现在微信上交互,本项目包括模型和工程化部署一体化。包含查天气,知识图谱聊天查询,生成式问答聊天查询,图片识别,多次重复回答等;涉及到命名
实体识别
,相似匹配(bm25,bool检索,simbert等),bert+seq2seq生成,neo4j知识图谱查询等技术
chatbot_simbert 检索类型的微信聊天机器人/问答系统,通过API异步通信,实现在微信上交互,可以查询天气、重复问句识别等情况;本项目包括模型和工程化部署一体化。用到SimBert等模型。 描述 各位可以根据自己的需求部署或修改: 问答库如果是任务型的,就是一个任务型聊天机器人,如果闲聊的问答库,那就是闲聊型聊天机器人; 后续也可以添加意图,用来用意图识别的匹配;也可以添加个知识图谱的API... 总之可以添加的模块很多,扩展性非常强大。 品尝方式(使用说明) 准备: 环境准备:安装requirement中的依赖包 下载模型,并放置在code/1.retrieve_match/3.simbert_match/config路径下: simbert模型: 启动: 1、 启动code/2.API_serve/KG_service.py 2、 启动code/3.wx_project/c
2024-04-07 10:07:55
1.23MB
Python
1
NER命名体识别:文本标注工具Doccano配置方法/命名
实体识别
任务标注方法实例/标注导出与BIO处理/标签处理并完成对齐操作
命名
实体识别
(Named Entity Recognition,NER)是自然语言处理领域的一项关键任务,旨在从文本中识别和分类特定的命名实体,如人名、地名、组织机构名等。NER的目标是标记文本中的实体,并将其归类到预定义的实体类型中。 NER通常使用机器学习和深度学习技术来完成任务。以下是一种常见的NER流程: 数据收集和标注:收集包含命名实体的文本数据,并为每个实体标注相应的标签(实体类型)。 特征提取:从文本数据中提取有用的特征,如词性、词形、上下文等。这些特征将作为输入提供给模型。 模型训练:使用标注好的数据和提取的特征来训练NER模型。常用的模型包括条件随机场(CRF)、循环神经网络(RNN)、注意力机制等。 模型评估和调优:使用评估数据集来评估训练得到的模型性能,并进行调优以提高准确性和召回率。
实体识别
:使用训练好的NER模型对新的文本进行
实体识别
。模型将识别并标记文本中的命名实体,使其易于提取和理解。 NER在许多应用中起着重要作用,例如信息抽取、问答系统、文本摘要、机器翻译等。以帮助自动化处理大量文本数据,并提供有关实体的结构化信息,为后续的分析和应用提供基础。
2024-02-24 12:25:37
121.6MB
1
基于知识图谱的《红楼梦》人物关系可视化及问答系统(含码源):命名
实体识别
、关系识别、LTP简单教学
1) app.py是整个系统的主入口
2) templates文件夹是HTML的页面
|-index.html 欢迎界面
|-search.html 搜索人物关系页面
|-all_relation.html 所有人物关系页面
|-KGQA.html 人物关系问答页面
3) static文件夹存放css和js,是页面的样式和效果的文件
4) raw_data文件夹是存在数据处理后的三元组文件
5) neo_db文件夹是知识图谱构建模块
|-config.py 配置参数
|-create_graph.py 创建知识图谱,图数据库的建立
|-query_graph.py 知识图谱的查询 6) KGQA文件夹是问答系统模块 |-ltp.py 分词、词性标注、命名
实体识别
7) spider文件夹是模块 |- get_*.py 是之前取人物资料的代码,已经产生好ima
2024-01-17 15:33:50
5.71MB
知识图谱
命名实体识别
关系抽取
自然语言处理
NLP-project:自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名
实体识别
,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据
NLP-study 记录做过的NLP任务,包含但不限于文本分类,关系分类,命名
实体识别
,文本摘要,文本生成等,基于tensorflow2.0或者pytorch框架。
2024-01-12 21:57:28
83.48MB
Python
1
GMB(Groningen Meaning Bank)语料
这是GMB语料库的摘录,经过标记,注释和构建,专门用于训练分类器以预测命名实体,例如名称,位置等。 使用GMB(Groningen Meaning Bank)语料库进行命名
实体识别
的带注释语料库,该语料库通过自然语言处理将具有增强和流行特征的实体分类应用于数据集。
2024-01-03 18:36:44
24.85MB
命名实体识别
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
EEMD算法应用于信号去噪.rar
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
Academic+Phrasebank+2021+Edition+_中英文对照.pdf
Android大作业——网上购物APP(一定是你想要的)
基于ray filter的雷达点云地面过滤ROS节点
多目标微粒子群算法MOPSO MATLAB代码
DBSCAN算法Matlab实现
android开发期末大作业.zip
非线性本构关系在ABAQUS中的实现.pdf
风电场风速及功率数据.zip
校园网规划与设计(报告和pkt文件)
copula程序及算法.zip
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
锁相环simulink建模仿真.rar
全国道路网SHP数据.zip
最新下载
自然语言处理期末试卷2016年.docx
MapWinGIS.ocx
Microsoft Visual Studio 2010 Professional - CHS
2018中国科学院大学自然语言处理(含部分答案)期末考试题目
圈圈教你玩USB(第2版)高清加详细书签 Part2
极域电子教室管理系统软件V2.0 2022稳定版 支持Win11
批量改高程值的CAD命令
376.1通信,07电表,97电表规约报文解析工具
Symantec清除工具 CleanWipe_14.2.4815.1101版本
离散太阳黑子信号的时域滤波及其周期性分析
其他资源
USB-UART驱动
pss,pac,pnoise仿真方法
jdk1.8.0_181
经典小波变换EWT简化版
RSA算法python实现
东莞的一些土地利用类型(img dem)和矢量图(shp)--ArcGIS
EPLAN P8 S7200以及S71500的宏文件(.EMA)
百度地图API教程+案例
VC关联指定后缀名和打开程序
金橙子最新打标软件软件2.14.11
Detours库简单使用程序
MATLAB图像与视频处理实用案例详解——第 04 章 基于Hough变化的答题卡识别
数字化的武汉城区图
6年级导引第01讲拓展篇01.mp4
2020同等学力经济学综合精讲班-国际经济学讲义.pdf
DB2数据库ODBC驱动
烧录软件qbp_v311_e.exe
(亲测正确版)ASP.NET-c#-捕捉网页快照-网站截图-网站缩略图
点云sci文献
C# 简单爬虫C# 简单爬虫C# 简单爬虫
水电煤气管理系统
汽车俱乐部
fluent教程,学习CFD入门
s7-400组态
基于Android的无线点餐系统(服务器+客户端+数据库)