上传者: 38548434
|
上传时间: 2021-12-03 14:24:52
|
文件大小: 917KB
|
文件类型: -
采用数据挖掘中的聚类技术,对微软网站日志文件中的用户行为数据进行分析,在用户行为的基础上将用户归为同质的组,从而寻求一种识别典型访问情况的方法。采用了一种“将 SPR-SQ减小的情况屏蔽,只考虑 SPRSQ增加的情况”的处理方法,来实现最佳聚类个数 K的选择。同时,在计算组内偏差的时候,提出了“冗余组内偏差”的概念。在聚类分析阶段完成之后,对每个聚类结果进行“标准化均值”比较,并对其用户行为作了简要分析。