基于java的主题网络爬虫系统,功能十分简单,bug也多,谨慎下载

上传者: driftjiangyun | 上传时间: 2021-04-24 17:22:32 | 文件大小: 277KB | 文件类型: RAR
本项目是我的毕业设计项目。本人技术水平有限,写出来的东西bug很多,功能也非常不完善,承蒙老师照顾,答辩勉强通过。这个爬虫是针对特定站点的主题爬虫。具备多线程爬取、页面主题相关度计算、子链接主题相关度预测等功能。此外,还包含了一个简单的搜索引擎模块,用于对爬取结果的快速检索。 功能不算很完善,请谨慎下载。

文件下载

资源详情

[{"title":"( 142 个子文件 277KB ) 基于java的主题网络爬虫系统,功能十分简单,bug也多,谨慎下载","children":[{"title":"crawler.log <span style='color:#111;'> 246.00KB </span>","children":null,"spread":false},{"title":"pom.xml <span style='color:#111;'> 2.95KB </span>","children":null,"spread":false},{"title":"inputFiles.lst <span style='color:#111;'> 1.92KB </span>","children":null,"spread":false},{"title":"createdFiles.lst <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"pom.xml <span style='color:#111;'> 4.03KB </span>","children":null,"spread":false},{"title":"......","children":null,"spread":false},{"title":"<span style='color:steelblue;'>文件过多,未全部展示</span>","children":null,"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明