人们已经习惯于通过google、百度、Yahoo等知名搜索引擎在国际互联网中快速地查找到需要的信息。但是对于搜索企事业单位内部网中的信息而言,上述搜索引擎可就无能为力了。或者,对于某个行业而言,这些搜索引擎的搜索结果又过于宽泛了。   现在,深蓝搜索就为您解决这个问题!   深蓝搜索引擎由面向用户的Web搜索界面、自动网页索引机器人深蓝之蛛、发布广告和进行关键词竞价排名的深蓝商务中心和独立的数据库系统几大部分组成。其中前台WEB部分用ASP编写,后台数据库采用Microsoft SQL Server。而系统核心深蓝之蛛,负责网页采集、超链接提取等任务。这几部分有机结合,从而为您建立一个类似Google风格的Internet全文搜索引擎!   最佳适用范围:校园网、园区网、其它局域网,也可应用于Internet。
2023-05-15 12:08:43 6.74MB 搜索引擎
1
搜索引擎的JAVA实现,包含源代码,非常不错呦.
2023-04-28 21:11:49 869KB lucene 搜索引擎 JAVA
1
13个搜索引擎自动提交代码
2023-04-15 13:00:23 22KB 13个搜索引擎
1
烧瓶嗖嗖嗖嗖 一个简单的 python Flask 应用程序,它运行一个数据抓取器和一个 Whoosh 搜索引擎实现。 我写这篇文章主要是为了从 RSS 提要中抓取财经新闻(标题、出版日期时间、简要摘要),并将数据索引到 Whoosh 搜索引擎中。 只是一个尝试新事物的小爱好项目。 先决条件 BeautifulSoup - 烧瓶 - Whoosh - 以上所有都可以通过pip安装。 例如。 'pip 安装 Whoosh' 指示 1.安装需要的依赖2.添加你想抓取的RSS提要的url,即。 第 85 行,server.py。 请注意,您可能必须更改 scrape() 以迎合特定 RSS 提要的 XML 3. 使用“python server.py”运行服务器。 Flask 的默认端口为 5000 数据应该被抓取和索引,新文件将被添加到“/data”文件夹 用法 1. 要搜索特定术语,请
2023-04-12 22:45:09 35KB Python
1
PHP精仿百度搜索引擎源码搜猫 V9.0 正式版商业版.rar
2023-04-07 07:45:22 7.7MB 搜索引擎
1
主要介绍了Spring Boot集成ElasticSearch实现搜索引擎的示例,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
2023-03-30 13:48:03 140KB Spring Boot ElasticSearch Spring
1
Lucene实现的数码产品垂直搜索引擎 运用了dwz、htmlparser
2023-03-21 14:49:26 5.34MB Lucene 垂直搜索
1
黑客们最爱的搜索引擎谷歌,助你一臂之力.
2023-03-10 20:21:42 5KB 谷歌语法
1
电商搜索引擎solr的扩展词库,20W+的专业名词,txt文件;
2023-02-22 10:34:09 4.81MB 扩展词库 solr扩展词库 solr词库
1
针对上述问题,本文以燕山大学校园网为研究对象,在分析了网络搜索引擎的 原理、核心模块和运行流程的基础上,探索性地研究并实现了一个在Linux平台下 基于Python技术的面向校园网的原型搜索引擎。 首先,本文给出了搜索引擎的简要工作流程,介绍搜索引擎屮的一些关键的技 术,并着重分析了目前广泛运用的BM25搜索引擎检索模型。 其次,通过使用基于Python语言的Scrapy开源爬虫框架,BeautifulSoup网页解 析库,对搜索引擎的爬虫模块进行开发,指出了 Scrapy框架原有的URL去重方法会 导致针对大规模网站抓取时,内存耗费过大的问题,并提出了一种使用布隆过滤器 对Scrapy爬虫框架的URL去重功能进行改进的方案。同时,根据实际经验,提出了 两种防止爬虫被ban的策略。 再次,利用基于Python语言的Whoosh索引检索库,对本系统索引检索模块进 行开发。针对Whoosh对中文分词效果不好的问题,提出了使用jieba开源分词组件 来对Whoosh的中文分词功能进行改进。通过使用基于Python语言的Flask框架,来 实现用户界面,使用户可以通过网页端使......
2023-02-17 22:48:46 35.92MB
1