中文文本相似度讨算是中文信息处理相关研究领域中的重要基础, 在信息检索、 知识挖掘、 舆情分析等领域中有着广泛应用。 目前的中文文本相似度计算方 法大多是从文本的字形层面而不是从文本内容语义理解上计算文本间的相似度,这样得到的相似度值往往与人们的主观理解不一致。 本文深入分析和研究了当前 基于语义的中文文本相似度计算方法, 并针对方法中存在的问题进行改进, 使计 算得到的相似度能够更为准确地反映中文文本间的话义相似性。
1
该项目包含THUNLP开发的HowNet和OpenHowNet API的核心数据,它提供了一种方便的方式来搜索HowNet中的信息,显示字素树,通过字素计算单词相似度等。您还可以访问我们的以享受搜索和展示字母的字素的乐趣。在线单词。 如果您在研究中使用OpenHowNet提供的任何数据或API,请引用以下论文: @article{qi2019openhownet, title={OpenHowNet: An Open Sememe-based Lexical Knowledge Base}, author={Qi, Fanchao and Yang, Chenghao and Li
2021-12-07 13:21:32 111.7MB nlp semantics knowledge-base hownet
1
java 调用hownet具体 请参照 http://blog.csdn.net/qq675927952/article/details/7515866
2021-12-07 10:56:05 5.11MB 知网 hownet
1
可以用于词语 相似的的计算 工具中包含了中科院实现的 词语相似度计算工具
2021-12-06 15:03:07 1.71MB Hownet词典
1
hownet完整数据库
2021-11-13 23:04:41 3.71MB NLP 语义处理 文本挖掘
1
词相似度计算有重要应用在许多领域,例如自然语言处理,情报信息检索,文档聚类,自动应答, 词义歧义消除,机器翻译等。本文对基于词的相似度计算进行了深入研究知网和单词相似度的计算分为三个步骤:(1) 计算词素相似度,(2)计算概念相似度使用权重相似度的加权和方法,(3)取概念的最大相似度是单词相似度。 本文主要介绍对音素的编号,并介绍更多分解概念描述类型的准确方法。 这实验表明,提出了词相似度算法本文简单可行,计算结果为与意识相对一致。
2021-11-11 10:53:30 323KB word similarity; HowNet; sememe;
1
该资料包含知网情感相关的词典,分为中英文单词表,每种都梳理完毕,并整理成单独文件,非常方便,有需要的话,请下载使用。
2021-09-16 17:20:21 94KB 词典 NLP 图谱
1
------------------------------------------------------------------------------------- 基于情感词典的方法(知网整理的情感词典Hownet) 里边共有12个.txt 1.程度级别词语中英文 2.负面评价词语中英文 3.负面情感词语中英文 4.正面评价词语中英文 5.正面情感词语中英文 6.主张词语中英文
2021-08-20 09:44:16 83KB Honet
1
有关中文相似度计算的一款软件,基于知网。
2021-08-19 18:04:57 1.71MB hownet
1
知网Hownet情感词典
2021-08-10 09:07:45 89KB 文本挖掘 数据挖掘 情感分析
1