# 中文命名实体识别 基于条件随机场(Conditional Random Field, CRF)的NER模型 ## 数据集 数据集用的是论文ACL 2018[Chinese NER using Lattice LSTM](https://github.com/jiesutd/LatticeLSTM)中收集的简历数据,数据的格式如下,它的每一行由一个字及其对应的标注组成,标注集采用BIOES,句子之间用一个空行隔开。 ``` 美 B-LOC 国 E-LOC 的 O 华 B-PER 莱 I-PER 士 E-PER 我 O 跟 O 他 O 谈 O 笑 O 风 O 生 O ``` 该数据集就位于项目目录下的`data`文件夹里。 ## 运行结果 具体的输出可以查看`output.txt`文件。 ## 环境 首先安装依赖项: pip3 install -r requirement.txt 安装完毕之后,直接使用 python3 main.py > output.txt 即可训练、评估以及测试模型,评估模型将会打印出模型的精确率、召回率、F1分数值以及混淆矩阵
2022-06-18 18:04:51 613KB NER NLP CRF 源码
1
姿态分类训练代码: train.py为训练代码,会生成model.h5,替换平台端即可; data_deal为制作数据集,然后转为result.csv即可。读取本地摄像头制作。
2022-05-26 17:14:51 271B openpose 训练 数据集制作 安全监测
机器学习的五种聚类算法包括训练数据,基于python实现
2022-05-26 13:57:44 10KB 聚类
1
目标检测训练数据集 格式VOC 包含了xml标注文件,可以进行目标检测训练,识别水尺进而进行水尺识别等下游操作
目标检测训练数据集 格式VOC 包含了xml标注文件,可以进行目标检测训练,识别水尺进而进行水尺识别等下游操作
2022-05-19 22:06:28 524.36MB 源码软件
DFT的matlab源代码DFTFIT DFTFIT是python代码,它使用DFT计算(例如VASP,Quantum Espresso和Siesta)中的Ab Initio数据来开发分子动态势。 我们的软件包与其他类似的代码不同,因为我们利用LAMMPS作为计算器,可以实现多种功能。 潜在的功能包括自定义python函数以及各种或三体交互,包括Tersoff,Stillinger-Weber,Gao-Weber,Vashishta和COMB潜力。 所有这些都可以结合起来,例如具有白金汉+库仑+ ZBL的潜力。 我们还有大量的多目标和单目标,可以评估许多特性的潜力,包括能量,力,应力,晶格常数,弹性常数,体积模量和剪切模量。 通常,用户需要做三件事。 包括VASP,Siesta和Quantum Espresso计算。 另外,用户可以提供测量的特性,例如晶格常数,弹性常数,体积模量和剪切模量。 :指定优化算法和步骤数,用于存储结果的sqlite数据库以及要使用的MD计算器。 在丰富的两个和三个身体潜能中包括一个自定义的python函数。 最新发布 包装状态 执照 建置状态 文献资料 简报
2022-05-14 17:26:13 21.38MB 系统开源
1
红外海洋目标训练数据集(VOC标签,8402张图像).zip
2022-05-11 09:11:48 906.54MB 文档资料 红外海洋目标训练数据集
官网下载。公开数据集VOC2007.训练样本图书很多。总大小424M
2022-05-11 08:54:31 424.88MB VOC2007 数据集 深度学习 训练数据集
1
1.voc车辆检测数据集,可直接训练,数据已经处理 2.2000张主要包括:轿车、卡车、公交车、摩托车、自行车
2022-05-08 14:10:03 219.44MB voc 数据集 训练 车辆检测
此示例展示了如何对具有不平衡训练数据集的图像进行分类,其中每个类别的图像数量与类别不同。 两种最流行的解决方案是下采样和过采样。 在下采样中,每个类别的图像数量减少到所有类别中的最小图像数量。 另一方面,执行过采样时,每个类别的图像数量增加。 这两种策略对于不平衡的数据集都是有效的。 下采样的实现很简单:只需使用 splitEachLabel 函数并指定类的最小数量,但是,过采样需要更复杂的编码类型。 此代码不使用无法与增强数据存储关联的转换数据存储。 这意味着,到 2020 年,使用转换数据存储执行数据增强变得困难。
2022-05-07 17:16:08 40KB matlab
1