bigdata_analyse 大数据分析项目 希望 采用不同的技术栈,通过对不同行业的数据集进行分析,期望达到以下目标: 了解不同领域的业务分析指标 深化数据处理,数据分析,数据可视化能力 增加大数据批处理,流处理的实践经验 增加数据挖掘的实践经验 小费 项目主要使用的编程语言是python,sql,hql .ipynb可以用jupyter notebook :,如何安装,可以参考 jupyter notebook是一种网页交互形式的python编辑器,直接通过pip安装,也支持markdown,很适合用来做数据分析可视化以及写文章,写示例代码等。 列表 主题 处理方式 技术栈 数据集下载 离线处理 清洗蜂巢+分析蜂巢+可视化echarts 或者提取码:5ipq 实时处理 数据源kafka +实时分析flink +可视化(es + kibana) 提取码:m4mc 离线处理 清洗熊
2021-12-18 21:50:28 464KB Python
1
黑色星期五销售 简介:该项目将分析黑色星期五的销售数据,并获得更多见解,以回答以下关键业务问题。 什么是最大售出产品 哪个产品类别的销售额最高 查找购买者的年龄段和他们的intreset乘积 寻找买家的婚姻状况 分析在销售中具有较高兴趣的性别群体 我从挑选了数据集。 目录 安装 文件类型 结果 安装 使用下面的git命令随意克隆/分叉reporsity使用克隆github仓库 $ git clone https://github.com/mathubhalan/Black-Friday-Sales.git #文件类型 代码文件“ SalesAnalysis.ipynb”是该项目代码的jupyter笔记本格式。 数据文件夹包含从Kaggle下载的数据集“ BlackFriday.csv”。 许可证文件包含该项目的通用GNU许可证。 SalesAnalysis.html是笔记本文件
2021-12-16 18:26:14 5.46MB HTML
1
超级数据 零售数据分析
2021-12-16 08:23:45 718KB
1
纽约市出租车数据分析 在这个最后的小组项目中,我们以“理解出租车经济学”为主题分析纽约出租车数据,它是在 Map-Reduce 算法中使用 Hadoop Streamming API 和 Python 实现的。 调查的问题 不同社区的收入有何不同,它与社区的家庭收入中位数有何关联? 收入如何随时间变化? 出租车公司赚更多(或更少)钱的月份还是季节? 出租车司机在没有乘客的情况下可以行驶多久? 这如何随时间变化? 重大活动期间收入会受到影响吗? 例如,游行、总统访问、风暴 数据源 2013年出租车数据行程数据: : 票价数据: : 人口普查数据人口统计: : 收入信息: : 人口普查区域的形状文件: : (搜索“tract”) 天气数据 -- 选择“Surface Data, Hourly Global”,然后在选择地区的时候,选择NY和三个主站(Centra
2021-12-15 21:09:39 1.83MB HTML
1
华中科技大学大数据分析 实验内容 lab1 wordcount算法及其实现 lab2 PageRank算法及其实现 lab3 关系挖掘实验 lab4 kmeans算法及其实现 lab5 推荐系统算法及其实现
2021-12-15 17:05:40 6.3MB python
单细胞RNA-Seq分析 这个为期2天的课程将讨论从scRNA-seq实验获得的数据的计算分析。 贡献 我们欢迎您为改进本课程而做出的所有贡献! 如果您在此过程中有任何疑问,疑虑或遇到任何困难,维护人员将竭尽所能为您提供帮助。 我们想请您熟悉我们的《 ,并查看有关正确格式,在本地呈现课程的方式,甚至如何编写新剧集的。 请参阅当前列表,以获取有关对此存储库做出贡献的想法。 为了做出您的贡献,我们使用GitHub流,这在一章中有很好的解释。 维护者 本课程的当前维护者是 作者 可以在“找到该课程的参与者列表 引文 要引用本课程,请向咨询
2021-12-13 20:19:11 1.58MB Python
1
贷款批准预测:贷款申请数据分析
2021-12-12 19:12:57 179KB python data-science machine-learning data-mining
1
鸢尾花数据集分析与线性分类。数据统计特性分析。Logistic回归和SVM方法,分类可视化
2021-12-08 11:07:39 2KB svm分类iris iris python SVM
美国桥项目 该项目为美国的公路桥梁创建了一个数据库系统,并基于该数据库系统进行了数据分析。 基本工作集中在数据可视化上。 该项目的指导老师是来自深圳AIRS的丁博士。 该项目于2020年12月6日完成。
2021-12-07 18:24:42 61.45MB database datavisualization HTML
1
Taxi-Trajectories 可视化出租车轨迹分析
2021-12-06 15:46:50 210KB C
1