基于python语言实现FP-Growth算法,并通过实例实现其对销售订单的关联规则进行挖掘。
资料包括完整的源码文件。
实现方式:
要实现购物篮分析,其实有很多种方法,上面的几种考核指标都很清晰了,我们使用SQL也是可以统计的,只不过有点儿麻烦,需要手动做一个商品的组合,或者使用商品间笛卡尔积作为基础表,但是这还得看组合数量,如果只组合2种还好,组合3种、4种呢?
再就是使用Python或者R来做了,可以选择自己代码实现,也可以使用现有的开源包,我们只要用就行了,这里我也是直接使用了Python中的mlxtend拓展包。
数据处理:
这里把数据处理单独拎出来说一下,做关联分析,需要注意下数据的选取,比如有些行业需要考虑场景,如早中晚这种,每种场景下用户购物偏好不一样,每种场景都有适合的商品组合;
再比如最近的打折促销的商品要剔除掉,因为要走量,所以可能很多订单都有这件商品,会影响我们的最后结论;
还有就是一些附赠品,试用品,新人优惠的商品,都是会影响我们结论的一些数据。