中文全文索引xunsearch1.4.9版本。 Xunsearch 是一个高性能、全功能的全文检索解决方案。 Xunsearch 旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。 Xunsearch 中文译名为“迅搜”,代码中的经常被缩写为 XS,既是英文名称的缩略也是中文声母缩写。 这儿的“迅”是快速的意思,至少包含了两层涵义:其一代表了搜索结果的响应能力,其二则为二次开发难度、速度。 Xunsearch 采用结构化分层设计,包含后端服务、前端开发包两大部分,层次清晰而不交叉。 其中后端是采用 C/C++ 编写的守护进程,而前端采用最为流行的脚本语言 PHP ,对于 web 搜索项目更为方便。 具体参见架构设计。 Xunsearch 极大程度降低的搜索开发的难度,除了常规的中文分词、字段检索、布尔语法等功能外, 还比其它免费的解决方案提供了用户急需的相关搜索、拼音搜索、结果高亮、搜索建议等等。 具体的清单请参见我们的功能列表。 Xunsearch 真正全面开源,并使用最流行的开源许可协议 GPL 发布。您可以免费获取本项目的全部源代码, 自由的使用它,并在许可条件下修改和再分发,具体参见授权声明文件。
2022-05-04 18:43:50 9.84MB xunsearch1.4
1
xunsearch索引生成示例代码 简单生成索引部分,文档请参见官网
2021-03-16 15:49:11 298KB xunsearch 索引生成 搜索引擎 迅search
1
源码简介 分享的是一款搜索引擎源码,百度云盘爬虫源码,Python百度云网盘搜索引擎,爬虫+网站,搜索引擎采用Xunsearch高效搜索,源码很简单,附带安装教程,可二开,这里资源邦免费分享给大家,全自动更新百度云盘内容,全自动采集哦! 适用范围 百度云网盘搜索 引擎源码,百度搜索引擎源码,网盘搜索爬虫源码 运行环境 PHP+MYSQL+Python 测试截图 安装说明 1、上传源码到网站 2、创建名为pan的数据库,编码设为utf-8。然后导入sql,完成表的创建。 3、config.php 文件修改网站标题,描述等信息 database.php 修改数据库账号,密码等信息 4、启动爬虫 进入 spider/目录,修改spider.py 中数据库信息。 __如果你是第一次部署,需运行下面命令,完成做种__ python spider.py --seed-user 上面其实就是抓取百度云热门分享用户的相关信息,然后从他们开始入手爬取数据 然后运行 python spider.py 5、安装xunsearch 目前使用__xunsearch__作为搜索引擎,后面会更换为elasticsearch。 安装过程请参考(不需要安装,PHP SDK,我已经整合到web里了) http://xunsearch.com/doc/php/guide/start.installation 此时爬虫已经开始工作了 6、索引数据 上面我们完成了爬虫的数据抓取,网站的搭建,但还不能搜索,下面开始最后一步,索引的建立。 进入 indexer/目录,在indexer.php中将$prefix,替换为你web的根路径 require '$prefix/application/helpers/xs/lib/XS.php'; 并修改数据库账号密码 然后运行 python ./index.php 到此为止程序已全部安装完毕
2019-12-21 20:35:23 1.25MB 爬虫 百度云
1