中文单词向量 该项目提供了100多个中文单词向量(嵌入),它们经过不同表示(密集和稀疏),上下文特征(单词,ngram,字符等)和语料库的训练。 可以轻松获得具有不同属性的预训练向量,并将其用于下游任务。 此外,我们提供了一个中文类比推理数据集CA8和一个评估工具包,供用户评估其词向量的质量。 参考 如果使用这些嵌入和CA8数据集,请引用该论文。 沉力,赵哲,胡仁芬,李文思,刘涛,杜小勇, ,ACL 2018。 @InProceedings{P18-2023, author = "Li, Shen and Zhao, Zhe and Hu, Renfen and Li, Wensi and Liu, Tao and Du, Xiaoyong", title = "Analogical Reasoning on Chinese M
2021-06-03 19:26:17 354KB word-embeddings embeddings chinese embedding
1
表情符号2vec 这是我对Ben Eisner,TimRocktäschel,Isabelle Augenstein,Isabelle Augenstein,MatkoBošnjak和Sebastian Riedel在其论文中提出的表情符号嵌入进行训练,可视化和评估的尝试 。 他们的大多数结果都在此处用于在Keras中构建等效健壮的模型,包括仅基于表情符号描述的相当简单的训练过程,但是此版本使用全局向量而不是使用word2vec(最初提出的) 。 总览 包含用于处理表情符号描述以及训练和评估表情符号嵌入的代码 包含用于训练表情符号嵌入的正样本和负样本(发起)以及表情符号频率列表; 它还应在名
2021-05-01 22:44:01 3.37MB python emoji keras embeddings
1
本人精翻的《X-VECTORS ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION》
2021-04-14 18:47:26 388KB X-Vector 声纹识别 中文翻译 DanPovey
1
Aspect-Sentiment Embeddings for Company Profiling and Employee Opinion Mining.
2021-02-07 12:05:55 767KB 研究论文
1