感觉改造
使用此工具将任何词向量模型改造为语义本体,以导出特定于语义的向量。 由此产生的模型不仅捕捉到了语义差异,而且在几个语义任务上通常在经验上更好。 该技术的详细信息可以在 Jauhar 等人中找到。 阿尔。 (2015)。
要求
Python 2.7 一种。 麻木的湾scipy
数据
词向量
包含预训练词向量模型的文件。 第一行必须指定向量空间模型的维度,之后每行给出一个词向量。 有关示例,请参见data/samplevec.txt.gz 。
输出词向量的格式完全相同。 对于两者,纯文本和 gzip 文件都是可以接受的。
感觉本体
包含感觉本体的局部邻域描述的文件。 同样,gzip 和纯文本文件都是可以接受的。 每行指定一个词义及其所有具有权重的邻居。 一行的一般格式是:
<
2021-12-14 11:16:22
17.49MB
Python
1