包含20几个行业的文本语料,可用于文本分析,如文本相似度计算,文本挖掘,情感分析、关键词云图的构建等
2021-05-08 10:05:16 69.21MB 文本分析 关键词云图 文本相似度计算
1
基于依存句法分析的中文文本相似度计算研究,赵白玉,彭黎,中文文本相似度的计算在中文信息处理中起着极为重要的作用,在很多领域都有着广泛的应用前景。本文在改进了基于语义依存的汉语句
2021-05-03 20:22:04 213KB 中文信息处理
1
MSR数据集,是微软公开的相似度计算数据集,其中训练集有4076个句子,其中包含2753个相似度为1,即为正例句子;测试集有1725个句子,其中包含1147个正例句子。
2021-04-26 17:12:27 485KB MSR数据集 文本相似度计算
1
基于深度学习的文本相似度计算模型和代码,亲自跑过可以直接使用,对nlp领域的学习非常有借鉴意义,在智能问答系统上经常会用到。
2021-04-24 15:53:00 15.43MB 文本相似度 深度学习 智能问答
1
python自然语言处理-学习笔记(三)之文本相似度计算-附件资源
2021-04-22 22:27:52 106B
1
使用java实现输出文本相似度的一些代码。能够运行,有结果有数据。
2021-04-20 19:08:23 45KB java 文本 相似度
1
文本相似度计算的Simhash算法的实现与改进
2021-04-18 17:01:32 761KB Simhash
1
1、解压下载的CollaborativeFilteringBasedText压缩文件 2、操作系统中需装java jdk1.7或者以上版本 3、点击start.bat,在运行过程中,输出文本之间的距离和相似度
1
微博文本分析和可视化 0.数据来源和结构 新浪微博,爬虫链接: 微博内容数据结构(mongo数据库导出的json文档) content_example: [ {'_id': '1177737142_H4PSVeZWD', 'keyword': 'A股', 'crawl_time': '2019-06-01 20:31:13', 'weibo_url': 'https://weibo.com/1177737142/H4PSVeZWD', 'user_id': '1177737142', 'created_at': '2018-11-29 03:02:30', 'tool': 'Android'
2021-04-05 21:18:15 66.36MB visualization nlp weibo pyecharts
1
本系统是信息检索课程的一个关于文本相似度对比的程序,它是用Java设计的,你也可以直接点击里面的jar文件进行运行,本程序还可以用来防止同学进行文档作弊的作业,资源里面有还有它的使用方法。
1