网页排名
pageRank是一个简单的Python搜索蜘蛛,页面排名和可视化工具。 这是一组模拟搜索引擎某些功能的程序。 他们将数据存储在名为“ spider.sqlite”的SQLITE3数据库中。 可以随时删除此文件以重新启动该过程。 目的是提供一种简单的算法实现,该算法在其搜索引擎中用于按顺序对各种搜索结果进行排名。 Google的搜索引擎比我的搜索引擎复杂和先进,但基本实现保持不变。 Google会在应用其页面排名算法之前浏览整个万维网并获取所有链接,该算法需要高性能的计算系统和巨大的存储空间。 在我的实现中,我们从单个URL开始,对其进行爬网,并确定源自该URL的各种链接的等级。
我将提供算法的实现细节以及代码功能的解释。 我将很快上传完整的视频,展示该项目在YouTube上的实施情况; 但是到目前为止,我只使用给定的代码文件将实施细节留给我自己。
要求
运行此代码几乎没有要求
1