通过在网络中心选定的交换设备上配置镜像端口,向已配置好的服务器推送网络流量数据;服务器通过tcpdump工具把采集到的数据保存为cap文件;通过python等语言对流量数据文件进行解析,选取关键信息如用户标识(MAC)、目的地址、URL等,进行数据格式转换,完成敏感数据脱敏,将脱敏后的数据写入数据库;建立单个用户行为分析逻辑,能够对单个用户分析某时段的URL范围行为、周期、频率等进行分析;对大范围用户建立分类模型,对URL也建立分类模型,能够进行用户和URL分类;对用户分类和URL分类进行定性定量,建立数学分析模型;通过TensorFlow等机器学习平台进行模型分析,建立用户网络行为分析模型;在机器学习的基础上进行用户对比和URL对比,验证模型有效性和准确性;根据各分析结果建立WEB呈现界面,以表格和图形方式呈现分析结果;根据前序的研究结果总结方法和模型,进行结果评估和优化讨论,准备进入下一次研究迭代。
1