Cloaking-Detection-Tool
关于
尝试使用研究论文中给出的算法检测 HOTS 数据中的动态伪装:B. Wu 和 BD Davison,“Cloaking and Redirection: A Preliminary Study”,首届网络对抗性信息检索国际研讨会论文集 (AIRWeb) '05)。 日本千叶,第 7-16 页,2005 年 5 月。
它是作为信息检索课程“网页垃圾邮件检测工具”项目的一部分实施的(2014-2015 年第二学期,皮拉尼校区 BITS Pilani 的 N. Mehala 讲师)。 这个存储库只包括我的贡献,即伪装检测。 整个项目还包括使用内容分析和链接分析的网页垃圾邮件检测。
包括 HOTS 数据集以及用于生成它的源代码。
数据集生成方法
从找到了 google.co.in 最流行的前 10 个查询词。 (“TopQueries.tx
2021-07-19 14:03:03
265KB
Python
1