分类与预测
餐饮企业经常会碰到这样的问题:
如何基于菜品历史销售情况,以及节假日、气候和竞争对手等 影响因素,对菜品销量进行趋势预测?
如何预测在未来一段时间哪些顾客会流失,哪些顾客最有可能 会成为VIP客户?
如何预测一种新产品的销售量,以及在哪种类型的客户中会较 受欢迎?
餐厅经理需要通过数据分析来帮助他了解具有某些特征的顾客的 消费习惯;餐饮企业老板希望知道下个月的销售收入,原材料采 购需要投入多少,这些都是分类与预测的例子。
分类和预测是预测问题的两种主要类型。
分类主要是预测分类标号(离散、无序的)
预测主要是建立连续值函数模型,预测给定自变量的条件下因 变量的值
分类和预测是预测问题的两种主要类型。
分类主要是预测分类标号(离散、无序的)
预测主要是建立连续值函数模型,预测给定自变量的条件下因 变量的值
有监督学习/有指导学习/有教师学习
因为在分析测试数据之前,类别(目标列取值)就已经确定了
可以根据实际的类标号(目标列取值)和模型的输出来检验样 本是否处理正确
所以分类(预测)通常被称为有监督的学习
分类包括考察一类新出现的对象的特征,并归类到一定义类中
首先要有一个清晰定义的类,还要有一系列已分类实例
分类过程实际上是先在历史数据上建立某种模型,再将其用于 未分类数据进行分类
分类算法的目的是找出从属性到类标号的映射关系
表示形式:决策树,分类规则,神经网络,SVM,最近邻
分类问题举例
将信用卡申请者分为低、中、高风险
发现欺骗性理赔申请
将网上的每一篇文章按关键词分在不同组