本案例介绍命名实体识别(NER)任务的背景、HMM的原理以及如何将数据应用于序列标记问题,帮助同学们建立坚实的理论基础。 同学们可以通过这个案例学习序列标记问题和HMM的理论基础,从而建立机器学习的核心知识,利用HMM知识去解决实际NER问题,从而加深对理论的理解和应用能力。
2025-04-29 10:51:11 285KB 机器学习
1
下载资源是存放一个说明文档和一个exe可执行文件的压缩包,下载压缩后将这个exe可执行文件安装在你要重命名的pdf文件路径下。 在上级路径要有一个excel文件以xlsx为后缀的,里面要有两列,列名字为原文件名和新文件名,列下面为对应的文件名称,注意要带.pdf后缀。 双击exe可执行文件后,在exe文件上级目录会生成一个名字为新的文件夹,里面即为重命名后的pdf文件,同时还会生成一个名字为yanzheng的txt文件,可用于验证文件是否命名正确。同时会保留存原文件和其文件夹,确定原文件都命名成功后就可将其删掉。 说明:如果有要更改文件名的pdf原文件,将其放到存放原文件的文件夹中,双击exe文件,就可以重新生成更改文件名后的新文件,不用将之前生成后的名字为新的文件夹和验证文件删掉。
2025-04-15 20:22:50 86.43MB
1
基于pytorch+bilstm_crf的中文命名实体识别 文件说明 --checkpoints:模型保存的位置 --data:数据位置 --|--cnews:数据集名称 --|--|--raw_data:原始数据存储位置 --|--|--final_data:存储标签、词汇表等 --logs:日志存储位置 --utils:辅助函数存储位置,包含了解码、评价指标、设置随机种子、设置日志等 --config.py:配置文件 --dataset.py:数据转换为pytorch的DataSet --main.py:主运行程序 --main.sh:运行命令 --models.py:模型 --process.py:预处理,主要是处理数据然后转换成DataSet 运行命令 python main.py --data_dir="../data/cnews/final_data/" --log_dir="./logs/" --output_dir="./checkpoints/" --num_tags=33 --seed=123 --gpu_ids="0" --max_seq_len=128 --
2025-03-30 17:14:57 331KB pytorch bilstm
1
葵花8卫星数据产品netCDF文件命名含义(文件名以.nc结尾)。文件亦可从官网下载。
2024-07-16 16:29:24 4KB
1
BERT+BiLSTM+CRF是一种用于中文命名实体识别(Named Entity Recognition,简称NER)的模型,结合了BERT模型、双向长短时记忆网络(Bidirectional LSTM)和条件随机场(CRF)。 BERT是一种预训练的深度双向变换器模型,具有强大的自然语言处理能力。它能够学习上下文相关的语义表示,对于NLP任务非常有用。 BiLSTM是一种循环神经网络,能够捕捉上下文之间的依赖关系。通过同时考虑前向和后向上下文,BiLSTM能够更好地理解句子中实体的边界和内部结构。 CRF是一种概率图模型,常用于序列标注任务。它能够基于输入序列和概率分布进行标签推断,使得预测的标签序列具有全局一致性。 在BERT+BiLSTM+CRF模型中,首先使用BERT模型提取句子中的特征表示。然后,将这些特征输入到BiLSTM中,通过双向上下文的学习,得到更丰富的句子表示。最后,使用CRF层对各个词的标签进行推断,并输出最终的实体识别结果。 这种模型的优势在于能够充分利用BERT的语义信息和BiLSTM的上下文依赖性,同时通过CRF层对标签进行约束,提高了实体识别的
2024-07-02 15:37:12 801KB python 毕业设计 bert 自然语言处理
python编写的简单程序,一共只有130多行,但是应付老师绰绰有余:) 实验:基于LSTM的命名实体识别 数据处理 给每个实体类型进行编号、给每个单词进行编号 文本填充 使用标识符,将所有序列处理成同样长度 训练流程 给每个输入和其对应编号建立一个张量 构成训练批 输入LSTM单元 输入全连接层 使用sorftmax或其他分类器进行预测 模型构建 pytorch自带LSTM类/其他工具也可以/自己编码也可以
2024-05-08 15:06:16 1.85MB 自然语言处理 pytorch pytorch 课程资源
1
Lambda 算法是 Hea 的新版本
2024-04-28 17:04:07 294KB matlab
1
工程源代码。
2024-04-08 17:38:14 528KB
1
chatbot_simbert 检索类型的微信聊天机器人/问答系统,通过API异步通信,实现在微信上交互,可以查询天气、重复问句识别等情况;本项目包括模型和工程化部署一体化。用到SimBert等模型。 描述 各位可以根据自己的需求部署或修改: 问答库如果是任务型的,就是一个任务型聊天机器人,如果闲聊的问答库,那就是闲聊型聊天机器人; 后续也可以添加意图,用来用意图识别的匹配;也可以添加个知识图谱的API... 总之可以添加的模块很多,扩展性非常强大。 品尝方式(使用说明) 准备: 环境准备:安装requirement中的依赖包 下载模型,并放置在code/1.retrieve_match/3.simbert_match/config路径下: simbert模型: 启动: 1、 启动code/2.API_serve/KG_service.py 2、 启动code/3.wx_project/c
2024-04-07 10:07:55 1.23MB Python
1
主要介绍了在VB中遍历文件并用正则表达式完成复制及vb实现重命名、拷贝文件夹的方法,需要的朋友可以参考下
2024-04-01 08:00:46 59KB vb遍历文件完成复制 vb拷贝文件
1