一套内容采集系统源码

上传者: ss_geng | 上传时间: 2022-05-04 18:20:13 | 文件大小: 3.17MB | 文件类型: ZIP
一套内容采集系统源码 一套内容采集系统 解放编辑人员 内容采集系统,对于以内容为主的网站来说是非常好的助手,除了原创内容外,其它内容需要编辑人员或者采集系统来收集整理,然后添加到自己的网站里。Discuz DvBBS CMS等产品,内部都自带了一个内容采集功能,来采集指定的相关内容。 单客户端的火车头采集器也可以非常好的采集指定的内容。这些工具都是想让机器代替人工,把编辑人员从内容搬运的工作中解放出来,做一些更高端的工作,例如采集结果的内容微调,SEO优化,设定精确的采集规则,让采集的内容更加符合自己网站的需要。 下面的内容采集系统就是从这个想法开发而来的,这个采集系统由两个部分组成: 1. 编辑人员所使用的采集规则设定器和对采集结果进行审核、微调和发布所使用的Web站点。 2. 部署在服务器上的定时采集器和定时发送器。 首先由编辑人员通过一个采集规则设定器(NiceCollectoer.exe)设定要采集的站点,再等采集完成后,编辑人员再通过一个Web站点(PickWeb)对采集的结果进行审核、微调和优化然后发布到自己的网站上。编辑人员所需要做的是采集规则的设定,和对采集结果的优化,其它部分的工作都由机器完成。 NicePicker 是Html 分析器,用来抽取Url,NiceCollector 和HostCollector 都使用NicePicker来分析Html, NiceCollectoer 就是采集规则设定器,一个目标网站只用设定一次: 使用起来和最早的火车头采集器类似,这里使用博客园来做目标采集站点, 设定采集精华区的文章,采集规则非常简单:当编辑人员设定好采集规则后,这些规则会保存到NiceCollector.exe同目录下的 Setting.mdb中。一般当采集规则设定好以后,基本上不用再变动了,只在目标网站的Html Dom结构发生变化时,需要再次微调一下采集规则。NiceCollector同时用于新目标采集站点的设定和添加操作。 等编辑人员完成采集规则的设定后,把Setting.mdb放到 HostCollector.exe下, HostCollector 会根据Setting.mdb的设定进行真正的采集,并把采集的结果存入数据库。 到这一步就完成了内容的采集工作,编辑人员可以打开PickWeb,对采集结果进行微调和优化,然后审核通过并发送到自己的网站上 真正发送采集结果到自己网站的工作不是由PickWeb完成的,编辑人员完成内容审核后,PostToForum.exe 会读取数据库并发送这条通过审核的采集结果到自己的网站上,在自己的网站上当然需要一个. ashx或者某种其它方式来接收采集的结果,不建议PostToFormu.exe直接去操作自己网站的数据库,最好通过自己网站上的某个API,来接收采集结果。

文件下载

资源详情

[{"title":"( 282 个子文件 3.17MB ) 一套内容采集系统源码","children":[{"title":"Utility.cs <span style='color:#111;'> 883B </span>","children":null,"spread":false},{"title":"NicePicker.suo <span style='color:#111;'> 2.50KB </span>","children":null,"spread":false},{"title":"NiceWebClient.cs <span style='color:#111;'> 1.31KB </span>","children":null,"spread":false},{"title":"IPersistStreamInit.cs <span style='color:#111;'> 884B </span>","children":null,"spread":false},{"title":"NicePicker.dll <span style='color:#111;'> 20.00KB </span>","children":null,"spread":false},{"title":"......","children":null,"spread":false},{"title":"<span style='color:steelblue;'>文件过多,未全部展示</span>","children":null,"spread":false}],"spread":true}]

评论信息

  • qlc263 :
    真的不好用!!!晕,,而且编译通不过。。。一直VS2010报错
    2013-04-23
  • addmana :
    能用的,谢谢了
    2013-04-22
  • wwfjhx888 :
    有编译过的就好了
    2012-11-20
  • fzwxl29 :
    谢谢,很好。我已经下了,编译通过了,马上就能用啦
    2012-06-14

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明