上传者: 42136826
|
上传时间: 2022-02-04 17:33:23
|
文件大小: 4.36MB
|
文件类型: -
使用python 3的简单搜索引擎
这个小型项目将使用Vector Space Model实现一个简单的搜索引擎。 数据将从越南每日新闻如被抓取 ,, 和。
工具
如果未安装,请安装和 。
使用pip安装以下软件包:
(用于发出HTTP请求)。
(越南NLP工具包)。
(用于解析HTML和XML)。
$ pip install requests underthesea beautifulsoup4
(可选)安装pytest来运行单元测试:
$ pip install pytest
$ cd /path/to/project
$ pytest
安装并将该项目克隆到本地计算机中:
$ git clone https://github.com/vancanhuit/simple-search-engine.git
$ cd simple-search-engine
注意:如果