在文本分类中,基于Word2Vec词向量的文本表示忽略了词语区分文本的能力,设计了一种用TF-IDF加权词向量的卷积神经网络(CNN)文本分类方法.新闻文本分类,一般只考虑正文,忽略标题的重要性,改进了TF-IDF计算方法,兼顾了新闻标题和正文.实验表明,基于加权词向量和CNN的新闻文本分类方法比逻辑回归分类效果有较大提高,比不加权方法也有一定的提高.
1
word2vec Skip-Gram模型的简单实现 包括预料库 从维基百科提取出来的 。代码是python3的,可以直接运行。
2021-04-09 20:33:15 31.65MB Skip-Gram word2vec 自然语言处理 NLP
1