上传者: 42165583
|
上传时间: 2022-01-12 10:21:27
|
文件大小: 38.55MB
|
文件类型: -
pycrfpp
python CRF++实现分词
train and test
训练
训练数据采用1998年1月份人民日报的标注数据
tag => B M E S
训练模型调用接口
crf_model = CRFModel(model='model/model')
crf_model.crf_learn(filename='data/199801\u4eba\u6c11\u65e5\u62a5.data')
参数model为保存模型的路径, filename为标注数据路径
测试
crf_model = CRFModel(model='model/model')
data = crf_model.crf_test(tag_data=data)
测试结果
既往青霉素、链霉素、磺胺类药物过敏史<@>既_往_青霉素_、链_霉素、_磺_胺类_药物_过敏史
对“鸡蛋”等多种食物过敏<@>对_“鸡蛋”_等_多种_食物_过敏
对降脂药“非诺贝特