该数据集是用于命名实体识别训练模型的数据集,该数据集中包含6中标签,分别是人名、地名、时间、组织机构名、公司名、产品名。遵循BIO编码。里面有三个文件,分别是训练集,测试集,验证集。样例如下: 以 O 及 O 以 O 康 B-COMPANY_NAME 宽 I-COMPANY_NAME 为 O 代 O 表 O 的 O 国 O 外 O 专 O 利 O 产 O 品 O 低 O 毒 O 杀 O 虫 O 剂 O 吡 B-PRODUCT_NAME 虫 I-PRODUCT_NAME 啉 I-PRODUCT_NAME 和 O 生 O 物 O 农 O 药 O 阿 B-PRODUCT_NAME 维 I-PRODU
2021-04-01 18:54:08 742KB 命名实体识别 训练数据集 6类实体
1
信息提取中文 中文信息提取(包括命名实体识别,关系提取等)专注于最新的深度学习方法。 为了清楚起见,该项目有几个子任务,分别带有详细的README.md。 文件夹RE_BGRU_2ATT /中的详细信息 文件夹NER_IDCNN_CRF /中的详细信息 详情 参考
1
Tensorflow solution of NER task Using BiLSTM-CRF model with Google BERT Fine-tuning
2021-03-26 20:20:50 472KB Python开发-自然语言处理
1
基于jiagu和jieba的中文地区提取算法,用python语言编写,并用fastapi包装,可以被Java等请求结果
2021-03-23 21:50:16 947B fastapi jieba 地区提取 命名实体识别
1
通过命名实体识别解析判决文书
2021-03-15 10:05:59 29KB 命名实体识别 判决文书
1
Java 实现的自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 关键词提取 自动摘要 短语提取 拼音 简繁转换。.zip,自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁
2021-03-12 20:28:13 21.45MB 开源项目
1
中英文分词工具有很多,今天我们来使用Jieba、SnowNlp、nltk、thunlp、NLPIR、Stanford等六种工具来对给定中英文文本进行分词、词性标注与命名实体识别
2021-03-12 17:33:35 7KB 自然语言处理
1
主要实现使用了基于字向量的四层双向LSTM与CRF模型的网络.该项目提供了原始训练数据样本(一般醒目,出院情况,病史情况,病史特点,诊疗经过)与转换版本,训练脚本,预训练模型,可用于序列标注研究.把玩和PK使用
2021-03-10 13:15:00 37.02MB Python开发-自然语言处理
1
这个命名实体识别数据集是本人亲自整理的最终大型的数据集,供各位学习投票模型的亲朋好友们使用,本人亲自测试,效果非常好!!!!!!
2021-03-06 21:32:04 5.96MB NER 命名实体识别 数据集 机器学习
1
NER-LSTM-CRF 一个易于使用的命名实体识别(NER)工具包,在张量流中实现了LSTM + [CNN] + CRF模型。 该项目短期内不再维护,PyTorch版本: : 1.型号 Bi-LSTM / Bi-GRU + [CNN] + CRF,其中CNN层针对英文,捕获字符特征,通过参数use_char_feature控制self.nil_vars.add(self.feature_weight_dict [feature_name] .name)。 2.用法 2.1数据准备 训练数据处理成下列形式,特征之间用制表符(或空格)替换,每行共n列,1至n-1列为特征,最后一列为labe
2021-03-02 20:17:26 389KB tensorflow crf lstm deeplearning
1