这个是个人实验室做的ppt,主要讲了一下倒排索引,实践词典,bag of features,对比了一下mser和Mscr,其中含有mser与mscr的论文,有兴趣的童鞋可以下载,我本人是做搜索的
1
信息检索系统 利用倒排索引和向量空间模型实现的信息检索系统。 完成工作: 带位置信息的倒排索引 转化空间模型 TOP K查询 BOOL查询 初步查询 拼写矫正 名词查询 拼写矫正(以下) 运行 环境要求:python3 在初次运行程序前请下载词干还原依赖的语料库 在SearchSystem/main.py中已经注释掉下载语料库的命令 nltk . download ( "wordnet" ) nltk . download ( "averaged_perceptron_tagger" ) nltk . download ( "punkt" ) nltk . download ( "maxnet_treebank_pos_tagger" ) 取消注释后运行一次即可,语料库下载完成立即正常运行 Windows下如果嫌弃弃语料库下载比较慢,可以直接转到目录下的nltk_data文件夹nltk_d
2021-04-30 11:39:21 65.66MB 系统开源
1
编写程序实现为给定目录下txt文件建立倒排索引文件il.txt 运行后会自动生成 1.txt,2.txt,4.txt,其中 1.txt,2.txt需要你自己输入需要排序的文档(如莎士比亚的文集),排序结果输出在il.txt中
2021-04-14 21:06:34 7KB 信息检索 倒排索引 C++
1
读入文本集,建立倒排索引,内含有的TXT文本可以替换,源代码可以直接运行
2021-04-14 19:20:52 4KB C++ 倒排索引 信息检索
1
绝对是最简单的,仅供参考,希望大家不要吐槽,不足之处希望大家指出=。=
2021-04-11 15:26:23 849B C++ 倒排索引
1
采用MFC可视化,通过建立倒排索引表,简单实现了搜索功能
2021-04-10 17:03:17 44.70MB mfc c++
1
读入文本集,建立倒排索引,内含有的TXT文本可以替换,源代码可以直接运行 读入文本集,建立倒排索引,内含有的TXT文本可以替换,源代码可以直接运行
2021-03-31 09:13:42 4KB C++ 倒排索引 信息检索
1
山东大学大数据课程的实验二。基于hadoop集群系统(也可以在伪分布式系统上运行)系统使用Java编写的倒排索引实现,具有使用停词表功能,使用正则表达式选择规范的单词。代码重构了setup(),map(),combiner(),partitation()和reducer()函数,功能是对文档进行倒排索引,得到一个单词有序,且单词的文件列表同样有序的倒排列表集合。
2020-05-11 22:24:38 6KB 倒排索引 大数据 Java hadoop
1
读入文本集,建立倒排索引,内含有的TXT文本可以替换,源代码可以直接运行
2020-01-03 11:37:42 3KB C++ 倒排索引 信息检索
1
C语言实现的倒排索引算法(含全部源码)
2020-01-03 11:23:12 2KB c语言
1