基于Word2vec词向量的文本关键字抽取,李清,朱文浩,信息技术的不断发展使得许多领域信息呈现爆炸式增长,如何从大规模文本信息中快速而准确地获取所需信息成为一个巨大的挑战。关键
2022-02-15 23:37:42 768KB 自然语言处理
1
textrank作为文档关键字提取的常用算法,python将textrank封装了对象,可直接使用
2022-01-31 03:09:52 3KB textrank
1
介绍: 今天在使用django的时候忽然想用到,如何匹配多个关键字的操作,我们知道django有一个objects.filter()方法,我们可以通过如下一句代码实现匹配数据库中title包含key关键词的文章名称。 table.objects.filter(title__contains=key) 问题: 但是我的需求是我不仅仅只需要匹配出一个关键字的文章而是多个关键字的文章,那么我们该如何使用django的objects.filter()? table.objects.filter(title__contains=key1)+.objects.filter(title__contain
2022-01-26 13:29:52 46KB c cts django
1
内容索引:PHP源码,查询搜索,关键字,百度排名,批量查询  运行于PHP环境的百度关键字排名查询程序,可以多域名、多关键字批量查询,使用时上传到空间,并将含有关键字数据的XML文件一并上传到同级目录下。特别提示:因为抓取百度数据,因此关键字的数量一次不要搞太多,一般几百个足够,如果查询量太大,可以准备多个xml文件。
2022-01-24 12:05:48 20KB PHP源代码 查询搜索
1
用python实现一个文档小工具(支持文档关键字筛选)-附件资源
2022-01-20 15:53:52 106B
1
Excel按照A1列关键字分离数据为多个sheet,并且,提供分离sheet为多个excel文件的功能
2022-01-11 22:23:39 13KB Excel 分离
1
阿里巴巴国际站关键字抓取工具-附件资源
2022-01-11 10:25:07 106B
1
帝国ECMS7.5自动生成关键字关键词插件
2022-01-07 11:03:52 15KB 帝国CMS7.5
1
有效的带关键字搜索的代理重加密方案
2022-01-06 09:57:13 814KB 研究论文
1
预处理的DUC 2001关键字提取基准数据集 该数据集已引入: 使用邻域知识的单文档关键词提取。 万晓军和肖建国。 在AAAI 2008年会议记录中。第855-860页。 数据集分为三个目录: references :用于评估的参考关键词 test :测试集 src :从中构建数据集的脚本和存档 每个输入文件都是使用Stanford CoreNLP套件v3.6.0处理的。 我们使用默认参数并执行标记化,句子拆分和词性(POS)标记。 文件为XML格式。 参考关键字短语为json格式,并根据以下规则进行命名: test.reader.[stem]?.json 读者提供的(无论是否阻塞)参考关键字短语以进行测试。 使用nltk Porter算法(英语)执行词干(如果已应用)。 以下是参考文件的玩具示例: { "doc-1": [ [
2022-01-05 15:30:42 5.34MB
1