上传者: 38726712
|
上传时间: 2022-01-06 03:30:34
|
文件大小: 581KB
|
文件类型: -
文本相似度计算被信息检索,问答系统,窃检测等广泛使用。 目前,大多数研究只是针对同一种语言的文本相似度,而跨语言文本相似度计算的研究很少,语言之间的差异使得跨语言文本相似度的计算非常困难,针对这种情况,本文提出了一种解决方案。基于WordNet的中文-老挝语跨语言文本相似度计算方法。 首先对医学上的中文文本和老挝文本进行预处理和特征选择,然后使用语义词典WordNet将中文文本和老挝文本转换为中间层语言,最后计算中间层中文和老挝文本之间的相似度。