沃尔玛数据零售分析 描述 美国最主要的零售商店之一沃尔玛(Walmart)希望准确预测销售和需求。 某些活动和节假日每天都会影响销售量。 有沃尔玛的45家商店的销售数据。 由于无法预料的需求,业务正面临挑战,并且由于不适当的机器学习算法,业务有时会断货。 理想的ML算法将预测不同时间点的需求,包括季节性和摄取因素,例如经济状况,包括CPI,失业指数等。 沃尔玛全年举办几次促销降价活动。 这些降价促销是在最重要的假期(超级碗,劳动节,感恩节和圣诞节)之前进行的,这是假期中最大的四个假期。 在评估中,包括这些假期在内的星期的权重是非假期星期的五倍。 在缺乏完整/理想历史数据的情况下,这场比赛所面临的挑战之一是对降价促销对假期假日的影响进行建模。 提供了位于不同地区的45家沃尔玛商店的历史销售数据。 数据集说明 这是历史数据,其历史记录涵盖了文件Walmart_Store_sales中从20
2024-02-01 15:52:53 2.87MB
1
项目介绍 DataLink是一个满足各种异构数据源之间的实时增量同步、离线全量同步,分布式、可扩展的数据交换平台。 项目背景 着眼于未来,我们的目标是打造一个平台,满足各种异构数据源之间的实时增量同步和离线全量同步,支撑公司业务的快速发展。在充分调研的基础之上,我们发现,没有任何一款开源产品能轻易的满足我们的目标,每个产品都有其明显的短板和局限性,所以最终的选项只有"自行设计"。但自行设计并不是凭空设计,现有的数据交换平台、已有的经验、大大小小的开源产品都是我们的设计根基,与其说是自行设计,倒不如说是站在巨人的肩膀上做了一次飞跃。由此诞生了DataLink这样一个产品: 满足各种异构数据源之间的实时增量同步和离线全量同步 平台提供统一的基础设施(高可用、动态负载、同步任务管理、插件管理、监控报警、公用业务组件等等),让设计人员专注于同步插件开发,一次投入,长久受益 吸收、整合业内经验,在架
2024-01-30 16:25:14 19.79MB data-exchange data-replication datalink
1
学习数据挖掘和机器学习的一本非常著名的书。是第二版。不太完美的地方是,本书是英文版。
2024-01-26 20:45:02 9.08MB 数据挖掘 data mining Morgan.Kaufmann
1
ApexSQL Data Diff 试用版 试用版 开发语言: 软件 可用平台: SQL Server 当前版本: v2015.01 ApexSQL Data Diff是业界领先的数据库数据比较和同步工具,它既有数据库比较功能,也有数据备份功能。通过功能强大的命令行接口(作为标准选项引用)将数据库比较进行自动化操作
2024-01-24 16:39:39 16.78MB
1
0. SpringData_源代码和PPT  · 1. SpringData_概述 · 2. SpringData_HelloWorld · 3. SpringData_Repository接口 · 4. SpringData_Repository查询方法定义规范 · 5. SpringData_Query注解 · 6. SpringData_Modifying注解 · 7. SpringData_CrudRepository接口 · 8. SpringData_PagingAndSortingRespository接口 · 9. SpringData_JpaRepository接口 · 10. SpringData_JpaSpecificationExecutor接口 · 11. SpringData_自定义Repository 方法
2024-01-17 15:28:57 68B java spring-data
1
中国地图echarts热力图(含全国以及各省json文件),以颜色深浅来展现全国各地用户数量
2024-01-17 11:26:48 7.87MB echarts json data
1
,机器学习应用程序的广泛部署激发了人们对利用存储在移动设备上的大量数据的兴趣。为了保护数据隐私,联邦学习被提出通过在参与设备上执行本地分布式训练并将本地模型聚合为全局模型来学习共享模型。然而,由于移动设备的网络连接有限,联邦学习在所有参与设备上并行执行模型更新和聚合是不切实际的。此外,跨所有设备的数据样本通常不是独立同分布的(IID),这对联邦学习的收敛性和速度提出了额外的挑战。 在本文中,我们提出了一个经验驱动的控制框架FAVOR,它可以智能地选择客户端设备参与每一轮联邦学习,以抵消非iid数据引入的偏差,并加快收敛速度。通过实证和数学分析,我们观察到设备上训练数据的分布与基于这些数据训练的模型权值之间存在隐式联系,这使我们能够根据该设备上上传的模型权值来描述该设备上的数据分布。然后,我们提出了一种基于深度q学习的机制,该机制学习在每个通信轮中选择一个设备子集,以最大限度地奖励,鼓励提高验证准确性,并惩罚使用更多通信轮。通过在PyTorch中进行的大量实验,我们表明,与联邦平均算法相比,联邦学习所需的通信轮数在MNIST数据集上最多可以减少49%。
2024-01-15 17:58:33 1.13MB pytorch pytorch
1
本文介绍了C51语言中变量在内存中的分配情况,以及建议的使用方法。
2024-01-13 23:15:02 58KB DATA 局部变量 large模式 startup.a51
1
The book's conceptual presentation focuses on ADTs and the analysis of algorithms for efficiency, with a particular concentration on performance and running time.
2024-01-11 16:53:05 6.41MB Data Structures Algorithm
1
Density Estimation for Statistics and Data Analysis, Silverman著, 1986年版,核密度估计教材
2024-01-09 16:20:52 5.05MB Density Estimation
1