mixed_corpus_bert_base_model.bin
2021-03-17 20:19:52 454.41MB 词向量
1
使用CNN和Word2vec进行文本分类 本文是参考gaussic大牛的“ text-classification-cnn-rnn”后,基于同样的数据集,嵌入词级别操作的CNN文本分类实验结果,gaussic大牛是基于字符级的;进行了第二版的更新:1。加入不同的卷积核; 2。加入正则化; 3。词唯一的中文或英文,删除掉文本中数字,符号等类型的词; 4。删除长度为1的词训练结果较第一版有所提升,验证集准确率从96.5%达到97.1%,测试准确率从96.7%达到97.2%。 本实验的主要目是为了探索基于Word2vec训练的词向量嵌入CNN后,对模型的影响,实验结果得到的模型在验证集达到97.1%
2021-03-11 19:01:08 15.65MB text-classification tensorflow word2vec cnn
1
关于词向量的理论推导视频,通俗易懂
2021-03-08 13:06:44 142.63MB 词向量 embedding NLP machine
1
课题实验
2021-03-06 09:09:01 8KB python
1
中文词汇分类百度百科词向量
2021-03-06 09:00:11 11KB python
1
知乎中文词向量
2021-03-02 10:12:10 255.14MB 词向量
python synonyms中所需的中文词向量文件,下载后请放置于/root/anaconda3/lib/python3.6/site-packages/synonyms/data/words.vector.gz
2021-02-18 18:07:14 158.23MB synonyms 中文词向量
NPL做词向量
2021-02-04 19:13:20 25.94MB 词向量
1
Win10下Gensim 3.8编译包,能大大提高词向量训练速度。 Python3.7 64位,VS2015编译。 解压后,用python setup.py install命令安装。 多台电脑测试可用。
2020-03-04 03:09:13 47.11MB Python Win10 Gensim
1