数据集包括: user.json ---用户信息数据表 item.json ---物品信息数据表 behavior.json ---用户行为数据表
2021-08-09 20:34:58 1.23MB 推荐系统 数据建模 机器学习 深度搜索
1
网络舆情是指在互联网上流行的对社会问题不同看法的网 络舆论,是社会舆论的一种表现形式,是通过互联网传播 的公众对现实生活中某些热点 焦点问题所持的有较强影 响力 倾向性的言论和观点。 近年来,网络舆情对政治生活秩序和社会稳定的影响与日 俱增,一些重大的网络舆情事件使人们开始认识到网络对 社会监督起到的巨大作用。同时,网络舆情突发事件如果 处理不当,极有可能诱发民众的不良情绪,引发群众的违 规和过激行为,进而对社会稳定形成严重威胁。因此需要 研究网络舆情与分析对象之间的关联性,寻找出与给定舆资源联系最紧密的分析对象
2021-08-08 09:09:26 1.66MB 数据分析 数据挖掘 数据建模 舆情分析
智能家居是利用先进的技术,融合个性需求,将与家居生 新功能,就能开拓新市场,实现产品的智能化。根据家居 的智能化,分析客户行为,识别不同客户群的特征、加深 对客户的理解等。(以热水器为例,分析客户行为) 针对不同的客户群提供个性化产品、改进新产品的智能化 的研发和制定相应的营销策略。 初步分析: 热水器在状态发生改变或者有水流状态时,每2秒会采集—条流水数据 。因为用户行为不仅仅只有洗浴还存在其他的用水事件:比如洗手、洗 菜等,所以热水器采集的数据来自各种不同的用水事件。 基于热水器采集的数据,根据水流量和停顿时间间佃划分为不同大小的 时间区间,每个区间是—个可理解的—次完整用水事件,并以热水器— 次完整用水事件作为—个基本事件。 从独立的用水事件中识别出其中属于洗浴的事件。
电能的大容量、长距离输送,主要 依靠架空线路,它们长期暴露于大气环 境之中,易受雷电、台风、暴雨、覆冰、山火等气象灾害的影响而导致故障。 台风、雷电等极端自然灾害在短时间内 会造成电网的多个设备故障,加上潮流 的转移、保护装置拒、误动的推波助澜,进—步加剧相继开断,甚至造成大面 积停电。 1)台风 广东平均每年有4~5个台风经过,是受台风灾害较严重的地区之—。台风 通过极大的风压和暴雨直接摧毁输电杆塔、输电线和风电场,或引发输电线不 规则舞动,或刮倒树木,刮起异物造成断线或短路,其影响与台风强度、路径 、输电线走向及地形等因素有关。 2)雷电 雷电是造成输电线路跳闸的主要原因。雷电通过机械、热力和电磁效应影 响电力系统:机械效应劈裂或倒塌建筑架构;热力效应熔化导体或热爆避雷针 ;电磁效应通过冲击过电压引起绝缘闪络或击穿,干扰电力通信。落雷密度与 雷电强度、潮热程度及地形环境有关。 3)风偏放电 在强风或跑线风的作用下,绝缘子串向杆塔方向倾斜,减小了导线与杆塔 的空气间隙,当距离不能满足绝缘强度要求时就会发生放电,称为风偏放电。 输电线路风偏跳闸是影响输电线路安全稳定运行的主要原因之—。 4)暴雨 暴雨会影响电气设备绝缘,导致盗套管发生雨闪。其闪络电压与降雨强度 、雨水电阻率及降雨间歇性有关。高盐分的暴雨破坏性更大,而强风进—步增 加对电气设备密封的威胁,雨洪、泥石流和城市内滂会损害低洼处的电力设施 ,特别是跨河沟及滑坡体上的杆塔。 5)……
2021-08-08 09:09:25 2.21MB 数据分析 数据挖掘 关联分析 数据建模
小结 5.3关联规则主要介绍了Apriori算法,以在一个数据集中找出各项之间的 关系; 5.4时序模式从序列的平稳性和非平稳型出发,对平稳时间序列主要介绍 了ARMA模型,对差分平稳序列建立了ARIMA模型,应用这两个模型对 相应的时间序列进行研究,找寻变化发展的规律,预测将来的走势; 5.5离群点检测主要介绍了基于模型和离群点的检测方法,是发现与大部 分其他对象显著不同的对象。 前5章是数据挖掘必备的原理知识,并为本书后面章节的案例理解和实验 操作奠定了理论基础。 聚类分析——常用聚类分析算法 与分类不同,聚类分析是在没有给定划分类别的清况下,根据数据相似 度进行样本分组的一种方法。 与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以 建立在无类标记的数据上,是一种非监督的学习算法。 聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度 将他们划分为若干组,划分的原则是组内样本最小化而组间(外部)距 离最大化
就餐饮企业而言,经常会碰到这样的问题: 客户在餐厅点餐时,面对菜单中大量的菜品信息,往往无法迅速找到满意 的菜品,既增加了点菜的时间,也降低了客户的就餐体验。 实际上,菜品的合理搭配是有规律可循的:顾客的饮食习惯、菜品的莹素 和口味,有些菜品之间是相互关联的,而有些菜品之间是对立或竞争关系 (负关联)。这些规律都隐藏在大量的历史菜单数据中,如果能够通过数 据挖掘发现客户点餐的规则,就可以快速识别客户的口味,当他下了某个 菜品的订单时推荐相关联的菜品,引导客户消费,提高顾客的就餐体验和 餐饮企业的业绩水平。 关联规则分析也成为购物篮分析,最早是为了发现超市销售数据库中不同 的商品之间的关联关系。例如一个超市的经理想要更多地了解顾客的购物 习惯,比如“哪组商品可能会在一次购物中同时购买?”或者“某顾客购 买了个人电脑,那该顾客三个月后购买数码相机的概率有多大?”他可能 会发现如果购买了面包的顾客同时非常有可能会购买牛奶,这就导出了一 条关联规则“面包=>牛奶”,其中面包称为规则的前项,而牛奶称为后项 。通过对面包降低售价进行促销,而适当提高牛奶的售价,关联销售出的 牛奶就有可能增加超市整体的利润。 关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集 中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。
个人或团体客户的信息分散在多个系统中、标准不统一、交互数据缺乏,各子公司之间的客户信息无法共享。客户信息质量不高,无法实现基于客户信息的数据分析和挖掘。
2021-08-03 21:05:52 829KB 数据建模
1
powerdesigner数据建模工具.rar
2021-07-22 13:01:48 121.57MB 工具软件
1
华为-标签平台与数据建模方案.pdf 华为标签管理工具-PISCES用户画像平台是一个分析型用户知识管理系统,使用用户画像 系统能够统一创建和管理用户标签规则、快速分析用户特征、查询用户画像、,帮助客户 实现统一用户知识管理和共享,并与客户的运营、分析系统有效集成,最终帮助客户实现 深入客户洞察、精准识别和个性推荐等差异化的用户服务
2021-07-21 17:02:32 1.81MB 华为 标签平台 数据建模 标签
1
一个类似于powerdesigner的数据库建模工具,是免费的
2021-07-21 16:35:06 5.09MB powerdesigner 数据库设计 数据建模
1