搜索【text-classification】的结果

BERT-中文文本分类-pytorch：此存储库包含用于文本分类的预训练BERT模型的PyTorch实现-源码

2021-08-27 20:50:35 46KB nlp text-classification pytorch chinese

1

Bert-Multi-Label-Text-Classification：此存储库包含用于多标签文本分类的预训练BERT模型的PyTorch实现-源码

2021-08-27 20:41:49 154KB nlp text-classification transformers pytorch

1

MarkTool:这是一款基于web、面向领域的通用文本标注工具，支持大规模实体标注、关系标注、事件标注、文本分类、基于字典匹配和正则匹配的自动标注以及用于实现归一化的标准名标注，同时也支持文本的迭代标注和实体的嵌套标注。标注规范可自定义且同类型任务中可“一次创建多次复用”。通过分级实体集合扩大了实体类型的规模，并设计了全新高效的标注方式，提升了用户体验和标注效率。此外，本工具增加了审核环节，可对多人的标注结果进行一致性检验、自动合并和手动调整，提高了标注结果的准确率-源码

DoTAT: A Domain-oriented Text Annotation Tool East China University of Science and Technology - NLP [华东理工大学-自然语言处理与大数据挖掘实验室] Attention 该工具已于2020年获得软件著作权，证书号：软着登字第5885316号，如需二次开发使用则要在项目中着重标明来源ECUST-NLP！ Notification 在线试用版网站（a live demo website）： An administrator account: Username:ecust Password:ecustlab301 A typical annotation process using DoTAT may include the following five steps: (1) Defi

2021-08-26 14:51:40 666KB text-classification event-extraction ner relation-extraction

1

doc2vec：使用Doc2Vec嵌入的长文本表示和分类-源码

Doc2Vec文本分类文本分类模型，该模型使用gensim Doc2Vec生成段落嵌入，并使用scikit-learn Logistic回归进行分类。数据集 25,000个IMDB电影评论，特别选择用于情感分析。评论的情绪是二进制的（1表示肯定，0表示否定）。与以下出版物相关联地收集了此源数据集： Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, and Christopher Potts. (2011). "Learning Word Vectors for Sentiment An

2021-08-22 20:41:39 12.96MB sentiment-analysis text-classification scikit-learn gensim

1

Text Classification.pdf

文本分类（自然语言处理 NLP）

2021-08-20 01:37:55 251KB 文本分类 自然语言处理 NLP

Kashgari：Kashgari是基于tf.keras构建的用于文本标签和文本分类的生产级NLP转移学习框架，包括Word2Vec，BERT和GPT2语言嵌入-源码

| | | :party_popper: :party_popper: :party_popper: 我们发布了带有TF2支持的2.0.0版本。 :party_popper: :party_popper: :party_popper: 如果您将此项目用于研究，请引用： @misc{Kashgari author = {Eliyar Eziz}, title = {Kashgari}, year = {2019}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {\url{https://github.com/BrikerMan/Kashgari}} } 总览 Kashgari是一个简单而强大的NLP Transfer学

2021-07-06 15:06:44 1.69MB nlp machine-learning text-classification named-entity-recognition

1

Text-Classification-pytorch:CNN BiGRU集成方法-源码

文本分类火炬通过CNN，RNN，集成方法对文本进行分类。 RNN的体系结构类似于有关CNN的代码在引用

2021-06-15 10:26:25 3.64MB Python

1

HanLP:中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现关键词短语提取自动摘要文本分类聚类拼音简繁转换自然语言处理

HanLP: Han Language Processing | | | | | 面向生产环境的多语种自然语言处理工具包，基于PyTorch和TensorFlow 2.x双引擎，目标是普及落地最前沿的NLP技术。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。借助世界上最大的多语种语料库，HanLP2.1支持包括简繁中英日俄法德在内的104种语言上的10种联合任务：分词（粗分、细分2个标准，强制、合并、校正3种）、词性标注（PKU、863、CTB、UD四套词性规范）、命名实体识别（PKU、MSRA、OntoNotes三套规范）、依存句法分析（SD、UD规范）、成分句法分析、语义依存分析（SemEval16、DM、PAS、PSD四套规范）、语义角色标注、词干提取、词法语法特征提取、抽象意义表示（AMR）。量体裁衣，HanLP提供RESTful和nati

2021-06-09 18:05:08 783KB nlp natural-language-processing text-classification hanlp

1

cnn-text-classification-pytorch:PyTorch中用于句子分类的CNN

介绍这是PyTorch中Kim的论文的实现。 Kim在Theano中对该模型的实现：： Denny Britz在Tensorflow中有一个实现： : 亚历山大·拉赫林（Alexander Rakhlin）在Keras的执行；要求 Python3 火炬> 0.1 火炬文本> 0.1 麻木结果我只是尝试了两个数据集，即MR和SST。数据集班级人数最佳结果金的论文结果先生 2个 77.5％（CNN-rand-static） 76.1％（CNN-rand-nostatic） SST 5 37.2％（CNN-rand-static） 45.0％（CNN-rand-nostatic）我没有为SST认真调整超参数。用法 ./main.py -h 或者 python3 main.py -h 你会得到： CNN text classificer o

2021-05-31 03:36:22 12KB pytorch cnn-model 附件源码 文章源码

1

Bert-Chinese-Text-Classification-Pytorch:使用Bert，ERNIE，进行中文文本分类

Bert-Chinese-Text-Classification-Pytorch 中文文本分类，Bert，ERNIE，基于pytorch，开箱即用。介绍模型介绍、数据流动过程：还没写完，写好之后再贴博客地址。工作忙，懒得写了，类似文章有很多。机器：一块2080Ti ，训练时间：30分钟。环境 python 3.7 pytorch 1.1 tqdm sklearn tensorboardX pytorch_pretrained_bert(预训练代码也上传了, 不需要这个库了) 中文数据集我从中抽取了20万条新闻标题，已上传至github，文本长度在20到30之间。一共10个类别，每类2万条。数据以字为单位输入模型。类别：财经、房产、股票、教育、科技、社会、时政、体育、游戏、娱乐。数据集划分：数据集数据量训练集 18万验证集 1万测试集 1万更换自己的数据集按照

2021-05-27 22:00:01 6.11MB 附件源码 文章源码

1

个人信息

热门下载

最新下载

其他资源