信息检索系统
利用倒排索引和向量空间模型实现的信息检索系统。
完成工作:
带位置信息的倒排索引
转化空间模型
TOP K查询
BOOL查询
初步查询
拼写矫正
名词查询
拼写矫正(以下)
运行
环境要求:python3
在初次运行程序前请下载词干还原依赖的语料库
在SearchSystem/main.py中已经注释掉下载语料库的命令
nltk . download ( "wordnet" )
nltk . download ( "averaged_perceptron_tagger" )
nltk . download ( "punkt" )
nltk . download ( "maxnet_treebank_pos_tagger" )
取消注释后运行一次即可,语料库下载完成立即正常运行
Windows下如果嫌弃弃语料库下载比较慢,可以直接转到目录下的nltk_data文件夹nltk_d
2021-04-30 11:39:21
65.66MB
系统开源
1