使用CNN和Word2vec进行文本分类 本文是参考gaussic大牛的“ text-classification-cnn-rnn”后,基于同样的数据集,嵌入词级别操作的CNN文本分类实验结果,gaussic大牛是基于字符级的;进行了第二版的更新:1。加入不同的卷积核; 2。加入正则化; 3。词唯一的中文或英文,删除掉文本中数字,符号等类型的词; 4。删除长度为1的词训练结果较第一版有所提升,验证集准确率从96.5%达到97.1%,测试准确率从96.7%达到97.2%。 本实验的主要目是为了探索基于Word2vec训练的词向量嵌入CNN后,对模型的影响,实验结果得到的模型在验证集达到97.1%
2021-03-11 19:01:08 15.65MB text-classification tensorflow word2vec cnn
1
嵌入表示学习是当下研究热点,从word2vec,到node2vec, 到graph2vec,出现大量X2vec的算法。但如何构建向量嵌入理论指导算法设计?最近RWTH Aachen大学的计算机科学教授ACM Fellow Martin Grohe教授给了《X2vec: 构建结构数据的向量嵌入理论》报告,非常干货!
2021-03-10 22:03:58 7.34MB 词嵌入
1
关于词向量的理论推导视频,通俗易懂
2021-03-08 13:06:44 142.63MB 词向量 embedding NLP machine
1
word2vec的实战文档
2021-03-08 13:06:43 2.09MB word2vec NLP embedding machine
1
之前在网上看过很多关于word2vec 的学习笔记,但都是拿拿其中一小部分进行阐述,基本没有比较全面和深入的讲解。由于word2vec涉及的基础知识比较多,对于word2vec如果要全面,可能要从基础线性回归 [10]、最小二乘法 [11]、sigmoid函数 [9][12]、Huffman树 [13]、softmax回归 [9][14]、词向量 [15]、似然估计 [17]等等。如需要了解基础知识,请先看相关参数文献;如需较全面的预热,请参考网易发一篇文章 [18](相信对word2vec有兴趣的同学都看过)。 本文适合在对word2vec算法有一定基础上,但想进一步了解word2vec的实现细节的同学。如遇到问题,最好参照着google源码实现进行理解(文章最后有源码参考)。
2021-03-06 20:36:58 5.69MB nlp word2vec deeplearning 原理
1
(word2vec 写的太好啦)word2vec Parameter Learning Explained.pdf
2021-03-01 16:12:27 800KB 自然语言处理
1
跳过思想火炬 Skip-Thoughts.torch是到Pytorch和Torch7的轻量级移植,它们是经过移植。 对火炬的跳过思考 跳过火炬7
2021-02-26 16:07:57 30KB word2vec torch gru rnn
1
word2vec在PyTorch中的实现代码及其数据,代码注释详细,数据文件完整。
2021-02-24 19:09:35 31.24MB word2vec
解压密码在https://blog.csdn.net/herosunly/article/details/89481947最后。非加密版本下载地址为https://download.csdn.net/download/herosunly/15450078。
2021-02-24 19:09:35 31.24MB word2vec
1
安装scipy、gensim库的必备库,我试验了很多次,最后是和gensim-3.8.1-cp37-cp37m-win_amd64.whl、scipy-1.4.1-cp37-cp37m-win_amd64.whl这两个版本配合才安装成功的。
2021-02-21 17:16:04 194.53MB scipy gensim mkl Word2vec
1