清华大学-哈尔滨工业大学 自然语言处理,测试集,开发集
2021-11-25 21:28:50 2.34MB 自然语言处理
1
传统文本分类使用word embedding作为文档表示,忽略词在当前上下文的含义,潜在地认为相同词在不同文本中含义相同。针对此问题提出一种词义消歧的卷积神经网络文本分类模型——WSDCNN(word sense disambiguation convolutional neural network)。使用双向长短时记忆网络(BLSTM)建模上下文,得到词义消歧后的文档特征图;利用卷积神经网络(CNN)进一步提取对文本分类最重要的特征。在四个数据集上进行对比实验,结果表明,所提出方法在两个数据集,特别是文档级数据集上优于先前最好的方法,在另外两个数据集上得到与此前最好方法相当的结果。
1
基于中文维基百科语料训练出的wiki.zh.text.model,压缩包中包含4个模型文件,提供百度网盘链接,下载即可。
2021-11-24 15:57:39 77B 自然语言处理
1
参考网上大神给的代码,自己调通了,使用隐马尔可夫模型进行中文分词
2021-11-24 14:52:48 2KB 自然语言处理 中文分词
1
以Transformer架构为基石、萃取NLP中最具有使用价值的内容、围绕手动实现工业级智能业务对话机器人所需要的全生命周期知识点展开,学习完成后不仅能够从算法、源码、实战等方面融汇贯通NLP领域NLU、NLI、NLG等所有核心环节,同时会具备独自开发业界领先智能业务对话机器人的知识体系、工具方法、及参考源码,成为具备NLP硬实力的业界Top 1%人才。
2021-11-24 13:07:14 235KB NLP Transformer 面试题 自然语言处理
1
“自然语言标注”(natural language annotation)技术,这种技术将检索对象的内容分解成不同颗粒度的信息片段,并用自然语言的句子和短语来标注
2021-11-23 21:00:54 2.13MB NLP 自然语言处理
1
HITSZ-NLP-EXP 哈工大深圳自然语言处理课程(本科)实验课讲义 第一部分 NLTK介绍 情感词典 Gensim 第二部分 pytorch简介 LSTM语言模型 TextCNN
2021-11-23 18:03:17 2.09MB JupyterNotebook
1
NLTK配套书《用Python进行自然语言处理》 中文版
2021-11-23 15:40:15 3.67MB NLTK
1
NLP自然语言处理相关数据集
2021-11-22 16:07:19 399.11MB NLP 数据集 语料
1