Agenda 从数据到信息 传统报表系统的挑战 数据分析与实战案例 数据挖掘与实战案例 总结:商业智能的巨大潜力 互联网行业 – 门户网站 传统的网站流量分析工具 简单的静态报表 后台处理,大量信息丢失 无法针对业务层面深入分析 OLAP 解决方案 18 个角度随心所欲的分析 瞬间获得结果 非常容易切入业务层面 发现更多的宝藏 电信行业 手机产业的迅猛发展导致: 海量的数据 海量的用户 激烈竞争与频繁的策略调整 OLAP 数据分析的价值 发现不断变化的规律 辅助正确的决策 好的决策 = $$$ 财务和预算 财务软件有很多 用友 金蝶 预算的方式有很多 Excel 专用系统 OLAP 可以分析什么? 鸟瞰图的分析方式 房地产 买房?卖房?租房? 房价的趋势如何? 不同地区的变化 不同类型的变化 供求关系的变化 OLAP 的解决方案 专业化的 KPI
实验一 SAS基本操作与数据集建立、浏览 【实验目的】 掌握启动SAS的方法,熟悉常用的操作界面;理解SAS数据库、临时|永久数据集等基本概念,熟练掌握建立数据集、浏览编辑数据集的基本使用方法。 【实验内容】  实验项目1 输入下列程序,运行并保存在恰当的文件夹中: data tmp; input name$ birthday date9. score1 score2 score3 wage comma8.2 percent; cards; zhangsanfen 02-oct-76 78 81 65 1,256.12 0.21 lisi 18-jan-75 74 93 65 1,080.5 0.15 wangwu 14,feb,74 88 90 95 2,040. 0.3 xuliu 30/jun/77 75 89 69 980.38 0.12 proc print; format birthday monyy7. wage dollar4.2; run; 上述程序建立了一个含有姓名、生日、项目1~3的考核分、工资、加薪比率这些字段的临时数据集tmp。 〖实验指导〗 有关知识 SAS主界面中有几个常用的工作窗口:“编辑窗口”用于录入、编辑程序;“日志窗口”用于显示SAS系统运行信息;“输出窗口”用于显示运行SAS程序产生的文字输出结果;……。 SAS主界面上有几个常用的菜单:有关文件操作的功能都组织在“文件菜单”中,SAS程序的提交运行、已运行过程序在编辑窗口的重新显示等功能组织在“运行菜单”中;……。  实验项目2。 试用编程方法和菜单|工具条方式分别建立用户数据库MyLib和MySas。 〖实验指导〗 有关知识 SAS主界面中工具条上有“创建新的数据库”工具图标 ,用于指定“库标识”与实际文件夹之间关联以创建一个逻辑数据库。 用libname语句可以创建、取消逻辑数据库。LIBNAME语句的一般用法为: libname 数据库名 [引擎] 库位置; libname 数据库名 (库位置1 库位置2 …); 库位置通常是‘目录的全路径文件名’表示;引擎为读写数据的格式说明,如v8,v6,xport等。  实验项目3。 有10位同学的名字、年龄、体重、身高数据如下表所示; 试用多种手段将这些数据新建为一个存放在MyLib库下的health永久数据集。
2021-08-08 17:09:27 1.02MB SAS 数据挖掘 数据分析 实验手册
案例1:XX服饰公司对货品管理主管要求 工作职责: 1、分析货品的市场走势,制定各季商品规划,按照公司营销计划,制定商品订货、上市计划; 2、负责新品上市、换季商品的调控管理,跟进货品的到货情况,规划、监督商品分配、补货、调拨、整合工作; 3、分析周转量,合理控制安全库存(含店铺库存),针对平、滞销品做出促销建议; 4、畅销商品及季节性商品作集中推广,以促进销售; 5、熟悉市场状况,能就竞争对手情况及市场变化作出分析,提供产品规划建议; 6、负责执行市场调查、消费者调查和分析工作; 7、制定物流解决方案,完善物流仓储配送系统,保证货品配送任务实现,提升客户满意度 案例2:XX服饰公司对货品分析员要求 工作职责: 1、根据月度及季度货品上市计划,负责货品分配后的跟踪,并对不合理处进行及时有效的货品调控,满足门店销售需求; 2、定期对店铺进行现场货品分析指导,形成指导意见记录并按计划完成调配内容,向上级主管报告; 3、负责日常各门店及总仓销售、库存数据统计分析及编制相关报表等工作; 4、协助货品主管做好货品月度、季度、年度货品分析,并提出合理改进的意见; 5、每月提供准确的仓库及店铺各季货品的库存、销量、销售进度等销售报表;及时了解反映控制各销售层次的销售情况和库存量; 6、配合并完成主管交付的日常物流管理工作。 我们所理解的货品分析员 他/她应该具备哪方面的能力? 1、对数据敏感、具备良好的数据分析与逻辑判断能力 2、熟练操作EXCEL以及公司SAP系统及POS系统 3、能熟练处理货品进、销、存账务核对以及货品分配工作 4、能全面负责订货、配货、调货、及控制库存等货品管理工作 5、对市场洞察的敏锐度较好,能够适时了解最新的流行走势 6、善于沟通与团队合作,能为一线战斗提供后台支持!
2021-08-08 17:09:26 2.42MB 数据挖掘 数据分析 货品管理 货品分析
第1章 数据分析哪些事儿 数据分析是“神马” 数据分析六部曲 常用指标或术语 【数据分析师的基本素质】 态度严谨负责 好奇心强烈 逻辑思维清晰 擅长模仿 勇于创新
2021-08-08 17:09:26 1.41MB 数据分析 数据挖掘 数据洞察 数据探索
基于Python数据分析与挖掘实战 实验数据和源代码 共12个章节,含每个章节的数据源和源代码demo
2021-08-08 13:07:27 334.67MB 数据挖掘 数据分析 python 实验
基于R语言数据分析与挖掘实战 配套数据数据和源代码 共15个章节,含每个章节的数据源和源代码demo
2021-08-08 13:07:26 426.83MB R语言 数据挖掘 数据分析 数据源
企业经营最大的目的就是盈利,而餐饮业企业盈利的核心就是其菜品和顾客,也就是其提供的产品和服务对象。企业经营者每天都在想推出什么样的菜系和种类会吸引更多的顾客,究竟各种顾客各自的喜好是什么,在不同的时段是不是有不同的菜品畅销,当把几种不同的菜品组合在一起推出时是不是能够得到更好的效果,未来一段时间菜品原材应该采购多少…… T餐饮的经营者想尽快地解决这些疑问,使自己的企业更加符合现有顾客的口味,吸引更多的新顾客,又能根据不同的情况和环境转换自己的经营策略。T餐饮在经营过程中,通过分析历史数据,总结出一些行之有效的经验:  在点餐过程中,由有经验的服务员根据顾客特点进行菜品推荐,一方面可提高菜品的销量,另外一方面可减少客户点餐的时间和频率,提高用户体验;  根据菜品历史销售情况,综合考虑节假日、气候和竞争对手等影响因素,对菜品销量进行预测,以便餐饮企业提前准备原材料;  定期对菜品销售情况进行统计,分类统计出好评菜和差评菜,为促销活动和新菜品推出提供支持;  根据就餐频率和金额对顾客的就餐行为进行评分,筛选出优质客户,定期回访和送去关怀。 上述措施的实施都依赖于企业已有业务系统中保存的数据,但是目前从这些数据中获得有关产品和客户的特点以及能够产生价值的规律更多依赖于管理人员的个人经验。如果有一套工具或系统,能够从业务数据中自动或半自动地发现相关的知识和解决方案,这将极大地提高企业的决策水平和竞争能力。这种从数据中“淘金”,从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是数据挖掘;它是利用各种分析工具在大量数据中寻找其规律和发现模型与数据之间关系的过程,是统计学、数据库技术和人工智能技术的综合。 这种分析方法可避免“人治”的随意性,避免企业管理仅依赖个人领导力的风险和不确定性,实现精细化营销与经营管理。
2021-08-08 13:07:25 528KB 数据挖掘 数据分析 RapidMiner 客户分析
RapidMiner Studio 结合技术性和适用性,为最新的及已建立的人性化数据挖掘技术提供服务。通过推拽算子,设置参数及组合算子,在RapidMiner Studio中定义分析流程。 正如我们将在下面看到的,流程能从大量的随机的可嵌套的算子中产生,最终表示为所谓的流程图(流程设计)。流程结构由内部的XML来描述,通过图形用户界面来开发。在后台,RapidMiner Studio 不断地检查当前流程开发状态,确保语法一致,并在问题出现时,能自动推荐解决方案。以上功能是通过所谓的元数据转换实现的,即在流程设计阶段转换基础元数据,预知流程开发结果,并在出现不合适的算子组合时确定解决方案(快速修复)。此外,RapidMiner Studio也能定义断点,因此能检查几乎所有的中间结果。成功组合的算子会被合并到构建模块中,因此在后期流程中它们还能被再次使用。 RapidMiner Studio包含了1500多个专业数据分析流程:从数据划分到以市场为基础的分析,再到属性生成,它包含了所有您需要的数据挖掘工具。同时也包含了文本挖掘,网页挖掘,对来自网络论坛的信息的自动情感分析(情感分析,观点挖掘)及时间序列分析,并能作出预测。 RapidMiner Studio为我们提供了强大的视觉化功能,例如三维图,散列矩阵和自组织地图等。在RapidMiner Studio里,您能够把您的数据转换为完全可定制的可输出的图表,并且支持缩放、移动及调整功能,以求最优化视觉效果。
2021-08-08 13:07:24 1.04MB 数据挖掘 数据分析 RapidMiner 挖掘工具
在上一个章节,我们熟悉了RapidMiner Studio图形用户界面的基本组成部分,例如透视图及视图,并讨论了RapidMiner Studio的设计透视图的最重要的一些方面。现在为了定义和执行一个原始的简单的分析流程,我们需要使用新的功能。您很快会发现RapidMiner的这项功能是多么的使用,您不需要在每次修改了流程以后都要执行一下新流程以确定修改后的效果。但是,这项功能可不仅仅只有这些好处。 3.1 创建一个新流程 不管是在透视图主页选择“新建”选项,还是点击RapidMiner Studio主工具栏左边的“新建”图标,还是进入“文件”菜单,都可以新建一个分析流程,以供接下来的使用。 提示:我们建议您把新建的流程保存在您的资源库中。 3.2资源库的选项功能 原则上,您可以完全自由的组建您的资源库。在资源库浏览器及资源库视图中的条目快捷菜单中,您会发现管理数据和流程所必须的所有条目,如图3.1所示。
2021-08-08 13:07:24 726KB 数据挖掘 数据分析 RapidMiner 分析流程
前面的部分中,我们已经看到了RapidMiner Studio图形用户界面是如何建立起来的,以及如何用它来定义和执行分析流程。在流程的最后,流程结果会显示在结果视图中。现在在工具栏上点击一下就能跳转到结果视图了。这一章会详细阐述结果视图。依据您是否已经生成了可被描述的结果,在默认设置前提下,您现在应该至少能大致看到这些显示内容 或者,您可以在“View(视图)”菜单中=“Restore Default Perspective(恢复默认透视图)”这一选项重新建立这个预设透视图。在介绍过的设计透视图之后,结果透视图是RapidMiner Studio的第二个主要工作环境。我们已经讨论了右侧的资源库视图,因此这一章节我们会关注视图的其他组成部分。 4.1结果可视化 我们已经看到了在流程执行完成后,流程中右侧结果端口的结果会自动显示在结果视图中。结果视图中左上角的大部分会被用到,那里显示了分析结果概述,在这一章节的结尾我们会讨论这些分析结果。 目前每一个打开的和显示的结果都会在这一区域以一个附加标签显示,如图4.2所示。严格来说,每个结果都是一个视图,像以往一样,您可以随心所欲的移动这些视图。这样的