上传者: Supreme7
|
上传时间: 2021-05-17 10:23:57
|
文件大小: 350KB
|
文件类型: -
包含课题的python源码,实验报告以及测试数据。
对于给定文本库,用户提交检索关键词(例如: NBA, basket, ball),在文本库中查询与检索关键词最相关的 k 个文本(例如 k=5),并根据文本与检索关键词的相关度,对这 k 个文本进行排序,将排序后的结果返回给用户。
使用TF-IDF权值衡量关键词对于某篇文章的重要性,从而根据关键词挑选出相关性较高的文本。首先程序加载文本库,并对数据进行处理,用户输入一个或多个关键词,分别输出前五的各检索关键词的文本排序序列。