基于分词的中文文本相似度计算研究
2021-05-18 22:19:41 377B 中文相似度 分词
1
gensim包的tfidf方法计算中文文本相似度,代码可直接运行,包含中文停用词,方便。
2019-12-21 20:39:02 52KB gensim tfidf 中文相似度
1
simhash算法对字符串计算权重时,对中文要做特殊操作,及先分词,请自行下载sanford中文分词jar包及中文分词库
2019-12-21 20:35:36 3KB 中文分词 simhash 中文相似度
1