布尔检索引擎
这是用于布尔检索的索引和搜索技术的 Python 实现。 布尔查询包含运算符AND 、 OR 、 NOT 、 (和) 。 这是有关布尔检索及其技术的更多信息的良好 。
要求
已安装
用于索引和搜索以数字命名的组成文档的语料库(例如 NLTK 数据中的路透社语料库)
索引
$ python index.py -i -d -p
是要索引的文档集合的目录
是索引器要创建的字典的文件名
人类可读
第一行包含元信息的元数据并指示所有按升序索引的docID:例如“Indexed from docIDs:1,5,6,9,10,11,12,13,14,18,19,22,23,24,27 ,2
2021-11-04 07:48:26
7KB
Python
1