主要实现使用了基于字向量的四层双向LSTM与CRF模型的网络.该项目提供了原始训练数据样本(一般醒目,出院情况,病史情况,病史特点,诊疗经过)与转换版本,训练脚本,预训练模型,可用于序列标注研究.把玩和PK使用
2021-06-06 13:02:47 37.02MB Python CCKS2017 LSTM CRF
该数据是完整的BIO标注语料,可用于深度学习机器学习模型训练,分为训练集、测试集以及验证集。
2020-10-25 18:37:48 1.82MB BIO标注 深度学习 训练预料
1