Word2Bits-量化词向量
Word2Bits扩展了Word2Vec算法,以输出高质量的量化词向量,该向量的存储量比常规词向量少8到16倍。 在阅读详细信息。
什么是量化词向量?
量化词向量是词向量,其中每个参数是2^bitlevel值之一。
例如,“国王”的1位量化矢量看起来像
0.33333334 0.33333334 0.33333334 -0.33333334 -0.33333334 -0.33333334 0.33333334 0.33333334 -0.33333334 0.33333334 0.33333334 ...
由于参数限制为2^bitlevel值之一,因此每个参数仅使用bitlevel位来表示; 这大大减少了词向量占用的存储量。
下载预训练的单词向量
所有单词向量均为Glove / Fasttext格式(格式详细信息)。 使用gzip压缩文件。
每个参数位
2021-02-20 09:05:14
1.2MB
C++
1