网络搜索引擎 信息检索课程作业,基于空间向量模型和PageRank的搜索引擎。代码的组织以及使用,请查看实验报告。
2021-12-05 11:06:16 10.84MB Python
1
eswork ElasticSearch+Django+Scrapy搜索引擎 项目功能 scrapy爬虫获取数据存储至es,ElasticSearch+Django实现搜索页面。 快速开始 # 下拉项目代码 git clone https://github.com/downdawn/eswork.git # 安装requirements.txt依赖 pip install -r requirements.txt # 启动Elasticsearch-RTF cd elasticsearch/bin elasticsearch.bat # 启动爬虫,获取部分数据 cd eswork/articles python main.py # 启动Django cd eswork/lcvsearch python manage.py runserver 感谢老师分享知识 其他详情见博客 个人博客: 或者
2021-11-28 11:11:14 172KB Python
1
py-elasticsearch-django EseachDjango文件夹是整个项目的web前引入采用Django框架,调用redis中间间,ES接口,前端为采用框架。 spider文件夹是用scrapy框架抓取几十个小说数据网站 ES接口语法案例: Rest接口添加 http的put方式 PUT jiechao { “settings”:{ “index”:{ “number_of_shards”:5, “number_of_replicase”:1 } } } Es的文档,索引的CURE操作(增删改查) 索引的初始化,索引类似关系数据库中的数据库
2021-11-22 13:52:46 1.09MB python elasticsearch django spider
1
采用Python3.5,可以爬取文章,问答以及招聘网站的内容。
2021-11-18 09:56:30 1.2MB python爬虫
1
搜索引擎 目前只支持英文字母,即不支持Unicode 。 哈希表是从头开始实现的--- std::hash未使用--- 具有功能。 快速统计:该程序大约需要 4 秒钟来初始化哈希表,扫描大小约为 100 兆字节的文件并创建一个哈希表进行搜索。
2021-11-15 20:00:10 14KB C++
1
RecipeSearchEngine 搜索引擎的食谱
2021-11-14 15:13:13 146.74MB Python
1
wechat_search api for wechat subscribe account and articles by sogou search install composer require ctwj\wechat_search_api example getInstance 获取实例 $instance = \Ctwj\WechatSearch\WechatSearch::->getInstance(); or $instance = \Ctwj\WechatSearch\WechatSearch::getInstance( [ 'cachePath' => 'path to save cache', //缓存路径,结尾需要友分隔符, 默认项目内 'cacheTime' => 10, //分钟数,为0时关闭代理,
2021-11-08 20:47:01 70KB PHP
1
RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数 据库来存储你网站所有页面的关键词以便快速搜索。Risearch是全文搜索引擎脚本,它把所有的关键词都编成一个文档索引除了配置文件里面的定义排除的 关键词。 RiSearch使用经典的反向索引算法(与大型的搜索引擎相同),这就是为什么它会比其它搜索引擎快的原因。
2021-10-29 16:32:36 39KB php 搜索 引擎 源码
1
预览地址:https://www.suibianlu.com/1265.html;预览图:https://oss.11yuanma.com/zb_users/upload/2015/12/201512201450587359797394.jpg;
1
包含 开发自己的搜索引擎 lucene heritrix全部源码,包括前面的实验例子和后面的综合例子
2021-10-09 10:34:08 25.86MB 搜索引擎源码
1