BERTopic是一种主题建模技术,它利用BERT嵌入和c-TF-IDF创建密集的群集,从而使主题易于理解,同时又在主题描述中保留了重要的单词。 BERTopic是一种主题建模技术,它利用BERT嵌入和c-TF-IDF创建密集的群集,从而使主题易于理解,同时又在主题描述中保留了重要的单词。 相应的中等职位可以在这里找到。 关于项目算法的目录2.1。 句子转换器2.2。 UMAP + HDBSCAN 2.3。 c-TF-IDF入门3.1。 安装3.2。 基本用法3.3。 概述Google合作实验室1.关于项目返回目录
2021-08-03 10:35:53 5.78MB Python Natural Language Processing
1
mindspore-nlp-教程 mindspore-nlp-tutorial是针对谁正在使用MindSpore研究NLP(自然语言处理)的教程。 该存储库是从迁移的。 NLP中的大多数模型都是从Pytorch版本迁移而来的,少于100行代码(注释或空白行除外) 注意:所有模型均在GPU版本中实现,但未在Ascend平台上进行测试。 课程-(示例用途) 1.基本嵌入模型 1-1。 -预测下一个单词论文- 1-2。 -嵌入单词和显示图 论文- 2. CNN(卷积神经网络) 2-1。 二进制情感分类 论文- 3. RNN(递归神经网络) 3-1。 预测下一步论文- 3-2。 自动完成论文-长期记忆(1997) 3-3。 Bi-LSTM-预测长句中的下一个单词 4.注意机制 4-1。 Seq2Seq-更改单词 论文-使用RNN编码器-用于统计机器翻译的解码器来学习短语表示(
1
自然语言处理相关书籍,此为上册 This book introduces a number of fundamental techniques for computer semantics representation of natural language and performing inference with the result. Both the underlying theory and there inplementation in Prolog are discussed.
2021-07-24 18:07:45 1.14MB 自然语言处理
1
ABSA-PyTorch 基于方面的情感分析,PyTorch实现。 基于方面的情感分析,使用PyTorch实现。 需求 火炬> = 0.4.0 numpy的> = 1.13.3 斯克莱恩 python 3.6 / 3.7 变形金刚 要安装需求,请运行pip install -r requirements.txt 。 对于非基于BERT的模型,需要,请参阅了解更多详细信息。 用法 训练 python train.py --model_name bert_spc --dataset restaurant 所有实现的模型都列在。 有关更多训练参数,请参见 。 请参阅以获取k倍交叉验证支持。 推理 有关基于非BERT的模型和基于BERT的模型,请参考 。 提示 对于非基于BERT的模型,训练过程不是很稳定。 基于BERT的模型对小数据集上的超参数(尤其是学习率)更敏感,请参阅。 为了释放BERT的真正功能,必须对特定任务进行微调。 评论/调查 邱锡鹏等。 “自然语言处理的预训练模型:调查。” arXiv预印本arXiv:2003.08271(2020)。 张磊,王帅和刘
1
Natural-Language-Processing-with-Python-Cookbook.pdf
2021-07-16 20:31:18 32.13MB 综合文档
1
医学文献中的因果关系提取 使用条件随机场进行因果关系提取和识别。 这是我们的教师的项目。 到项目演示。 介绍 因果关系是两个事件之间的关系:因果。 原因是结果的产生者,而结果是原因的结果。 例如“饥饿是年轻婴儿哭泣的最常见原因。” 原因是“饥饿”,结果是“哭泣”。 当前的工作集中在从医学领域文本中检测和提取因果关系。 从检测因果关系的角度来看,以下区别可能有用: •标记或未标记:如果有特定的语言单位表示这种关系,则标记因果关系; 否则未标记。 标有“我买了它,因为我读了很好的评论”; “当心。 不稳定”不是。 •歧义:如果商标始终表示因果关系,则它是明确的(例如,“因为”)。 如果它有
1
维基SQL 一个庞大的众包数据集,用于为关系数据库开发自然语言界面。 WikiSQL是与我们的工作《 一起发布的数据集。 引文 如果您使用WikiSQL,请引用以下内容: 钟国,、熊才明和理查德·索赫。 2017年。Seq2SQL:使用强化学习从自然语言生成结构化查询。 @article{zhongSeq2SQL2017, author = {Victor Zhong and Caiming Xiong and Richard Socher}, title = {Seq2SQL: Generating St
1
Natural Language Processing with TensorFlow-Packt Publishing (2018).pdf 高清带目录
2021-06-25 10:08:30 8.08MB NLP tensorflow
1
LTP 4 LTP(Language Technology Platform) 提供了一系列中文自然语言处理工具,用户可以使用这些工具对于中文文本进行分词、词性标注、句法分析等等工作。 If you use any source codes included in this toolkit in your work, please kindly cite the following paper. The bibtex are listed below: @article{che2020n, title={N-LTP: A Open-source Neural Chinese Language Technology Platform with Pretrained Models}, author={Che, Wanxiang and Feng, Yunlong and Qin, Li
1
HanLP: Han Language Processing | | | | | 面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 借助世界上最大的多语种语料库,HanLP2.1支持包括简繁中英日俄法德在内的104种语言上的10种联合任务:分词(粗分、细分2个标准,强制、合并、校正3种)、词性标注(PKU、863、CTB、UD四套词性规范)、命名实体识别(PKU、MSRA、OntoNotes三套规范)、依存句法分析(SD、UD规范)、成分句法分析、语义依存分析(SemEval16、DM、PAS、PSD四套规范)、语义角色标注、词干提取、词法语法特征提取、抽象意义表示(AMR)。 量体裁衣,HanLP提供RESTful和nati
1