Transformers 提供了数以千计的预训练模型,支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨让最先进的 NLP 技术人人易用。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。同时,每个定义的 Python 模块均完全独立,方便修改和快速研究实验。 Transformers 支持三个最热门的深度学习库: Jax, PyTorch and TensorFlow — 并与之无缝整合。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。
2022-05-12 09:11:44 10.71MB tensorflow pytorch 自然语言处理 文档资料
自然语言处理数据集-5 万多条中文命名实体识别标注数据-中文命名实体识别.rar
2022-05-12 08:42:34 2.9MB 自然语言处理 人工智能 nlp
1
PyThaiNLP:使用Python进行泰国自然语言处理 PyThaiNLP是一个Python软件包,用于文本处理和语言分析,类似于 ,重点是泰语。 PyThaiNLPเป็นไลบารีภาษาไพทอนสำหรับประมวลผลภาษาธรรมชากับคล้ายกับNLTKโดยเน้นภาษาไทย รายละเอียดภาษาไทย 消息 我们正在进行2分钟的调查,以了解有关您使用图书馆的经验以及您对图书馆应该能够做什么的期望。参加。 版本 描述 状态 稳定的 发布候选版本2.3 请关注我们的以获取更多更新。 PyThaiNLP入门 我们提供了以探索PyThaiNLP的功能;我们也有针对特定任务的教程。请访问。 最新文档位于 。 我们尝试使该包尽可能易于使用;因此,某些其他数据(例如单词列表和语言模型)可能会在运行时自动下载。 PyThaiNLP默认在目录~/pyt
1
本课程为计算机学科研究生的专业核心课。本课程讲授和讨论自然语言处理前沿研究领域的主要思想和关键技术。主要内容包括语料库与语言知识库、词法分析、句法分析、概率语法、语义分析和机器翻译、文本分类、信息抽取与问答系统等。 通过本课程的学习,希望学生能了解自然语言处理前沿研究领域,了解人类语言技术的最新研究成果,掌握基本思想和关键技术,培养学生自然语言处理相关技术的研究能力。
2022-05-10 13:38:27 117.72MB 国科大 NLP 自然语言处理
1
采用Python编程和nltk库 统计中英文文本文件中词汇出现的频率并进行统计分析
2022-05-09 02:56:52 1.25MB 自然语言处理
1
1、内容概要:本资源主要基于TextCNN(keras)实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:textcnn_model.py是基于Keras构建CNN、TextCNN卷积神经网络模型对文本进行分类。
2022-05-07 08:29:02 11.13MB 文本分类 深度学习 TextCNN 自然语言处理
SEO搜索中文分词算法原理实战教程.doc
1500种疾病,相应的多维度疾病特征描述,可用于医疗大数据论文研究,适用于自然语言处理、数据挖掘分析、疾病预测
2022-05-06 16:47:24 325KB 机器学习 自然语言处理 数据挖掘
1
自然语言处理很值得一看的一本书
2022-05-06 11:26:34 67.14MB 自然语言 nlp
1
Content 文本预处理;语言模型;循环神经网络基础 机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer 一、文本预处理 文本数据的常见预处理步骤,预处理通常包括四个步骤: 读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型 Code #文本预处理具体操作 #1、读入文本 import collections import re def read_time_machine(): with open('/home/kesci/input/timemachine7163/timemachin
2022-05-05 16:16:27 461KB 机器学习 自然语言 自然语言处理
1