这是 ShowMeAI 持续分享的速查表系列!《2022年人工智能专家成长路线图》是一组图表,展示了成为数据科学、机器学习工程师或人工智能专家的成长路径,包含数据科学路线图、机器学习路线图、深度学习路线图、数据工程师路线图、大数据工程师路线图等 7 个主题,可视化效果非常酷炫!
2023-01-01 10:24:35 634KB 机器学习 深度学习 大数据 数据分析
1
51杨杨.ipynb
2022-12-31 14:24:16 680KB 大数据
1
《Spark 调优攻略上册》是整合互联⽹优质的Blog与PPT形成的攻略,它主要对于企业级⼤规模数据计算引擎Spark多维度优化策略。本次整理不单单是Apache spark还涵盖了Data Lake和阿⾥云EMR智能团队研发的Jindo-Spark是如何基于Apache spark进⾏多维优化及实现原理,让读者能够知其然且知其所以然。
2022-12-31 14:23:20 25.42MB 攻略 大数据 Spark调优
1
第六届Mathorcup数学建模竞赛A题 淡水养殖池塘水华发生及池水净化处理数据
2022-12-31 12:25:25 757KB 大数据竞赛
1
电子商务中会产生海量的数据,蕴含着不可估量的数据价值,可通过数据分析来挖掘这些潜在价值,以提升平台的销量。本次实践项目利用 Hadoop 的分布式计算框架 MapReduce 来分析用户行为数据,计算得出商品点击排行、商品分类占比等统计指标,使得更加熟练掌握 MapReduce 程序的设计。 相关理论知识有,Map 和 Reduce 流程图如下:输入数据(INPUT)首先分割(SPLIT)成若干份,然后每份分别进行 MAP 过程;中间再经过 COMBINE 任务(可选)和 PARTTION 对 MAP 所得的结果进行聚合——把同 key 的结果放到同一组,最后再进行 REDUCE 过程。
2022-12-31 12:22:06 4.19MB 电子商务 大数据 Hadoop MapReduce
1
使用MongoDB,Hadoop大数据和Spring技术开发电子商务应用程序 该电子商务项目展示了如何使用MongoDB,Hadoop大数据和Spring技术来开发电子商务应用程序。 该应用程序包括几个基本的电子商务组件:“产品目录”组件,“库存管理”组件和“产品类别”组件。 分片的MongoDB集群为产品目录数据,产品库存数据和其他应用程序数据提供存储。 应用程序域模型基于MongoDB POJO类构建。 建立了一个包含100000多种产品的示例数据库,以支持E-Commerce应用程序。 Hadoop大数据技术用于自动发现电子商务应用程序中数据的用户见解。 Hadoop集成主要通过开发Map / Reduce作业来实现。 已开发的Map / Reduce作业在MongoDB和Ubuntu平台上运行。 Spring和Spring Boot技术用于为电子商务应用程序提供系统集成平台。
2022-12-30 21:41:09 18.64MB Java
1
基于Oracle的大数据解决方案: 什么是大数据? 具有4V特性的数据称为大数据: 巨大的数据量 Volume •集中储存/集中计算已经无法处理巨大的数据量 多结构化数据 Variety •文本/图片/视频/文档等 增长速度很快 Velocity •海量数据的及时有效分析 •用户基数庞大/设备数量众多/实时海量/数据指数级别增长 价值密度低Value •单条数据并无太多价值,但庞大的数据量蕴含巨大财富
2022-12-30 16:59:25 3.55MB 大数据 oracle
1
包含葡萄酒数据集的相关文件
2022-12-29 21:51:16 306KB 机器学习 大数据
1
本文SparkStream从磁盘文件、HDFS、KAFKA获取数据源,以单词频次统计作为入门案例,介绍了SparkStream模块API的使用。同时介绍了SparkStream的特点
2022-12-29 17:25:28 354KB 大数据 Spark SparkStreaming
1
Flink1.14.4自定义flink-connector-jdbc连接SQLServer和SAP数据库
2022-12-29 16:10:19 250KB flink 大数据
1