数据架构师第006节实战.基于hadoop streaming的wordcount .mp4
2022-04-07 14:07:51 85.09MB hadoop 大数据 big data
流分位数 该代码实现了Zohar Karnin,Kevin Lang和本人(Edo Liberty)在论文《中的描述的最简单算法。 它是免费分发的,没有任何形式的保证。 不应将其视为已准备好用于生产。 它被写为一种学术工具,供论文读者重现我们的结果。 它没有以任何方式进行优化。 用法 kll.py中的主类 $ python kll.py -h usage: kll.py [-h] [-k K] [-t {string,int,float}] optional arguments: -h, --help show this help message and exit -k K controls the number of elements in the sketch which is
2022-04-06 14:17:57 77KB JupyterNotebook
1
使用pyspark的stream操作kafka时,需要用到的jar包
2022-04-06 02:48:09 296KB kafka spark jar 大数据
1
使用pyspark的stream操作kafka时,需要用到的jar包
2022-04-06 02:48:08 9.98MB kafka spark jar 大数据
1
常见问题我还需要其他任何东西来使程序正常工作吗? 如果您使用的是Windows XP或更低版本,则可能需要安装免费的Microsoft .NET,以使该程序能够与您的系统一起使用。 该程序支持哪些站点? YouTube,DailyMotion,Google Video,Megavideo,Metacafe和Vimeo。 为什么我不能下载某些视频? 由于以下某些原因,某些视频无法下载:在您所在的国家/地区或受年龄限制的某个国家/地区,该视频已被禁止播放,或者您无法访问正在下载的网站。如果程序停止运行,会发生什么? 如果由于该程序内的下载问题而导致该程序无法正常运行,我们将尽力对此进行修复。 否则,我们将尽最大努力通过我们的网站提供任何解决方案。
2022-04-03 17:39:49 278KB 开源软件
1
uTextureSendReceive Unity线程网络纹理发送器和接收器插件,用于视频和纹理流 这是一个小程序包,提供了一个线程接口,用于通过TCP / IP发送和接收任何Unity纹理。 它可以用于流传输视频,网络摄像头以及任何2D或渲染纹理,例如视觉效果的一部分,小地图等。 查看这些示例,这些应用程序在后台运行的2万个粒子系统在不中断的情况下进行流式传输和接收;) 流实时网络摄像头 流式视频播放器 流式游戏摄像机视图 产品特点 简单的基于纹理的界面,用于发送图像/视频/纹理/等。 通过TCP / IP。 线程发送和接收可改善项目其余部分的性能。 可配置的编码和质量设置。 示例网
2022-03-28 10:51:09 9.31MB streaming unity texture unity3d
1
常见问题我还需要其他任何东西来使程序正常工作吗? 如果您使用的是Windows XP或更低版本,则可能需要安装免费的Microsoft .NET,以使该程序能够与您的系统一起使用。 该程序支持哪些站点? YouTube,DailyMotion,Google Video,Megavideo,Metacafe和Vimeo。 为什么我不能下载某些视频? 由于以下某些原因,某些视频无法下载:在您所在的国家/地区或受年龄限制的某个国家/地区,该视频已被禁止播放,或者您无法访问正在下载的网站。如果程序停止运行,会发生什么? 如果由于该程序内的下载问题而导致该程序无法正常运行,我们将尽力对此进行修复。 否则,我们将竭尽所能通过我们的网站提供任何解决方案。
2022-03-23 00:29:04 166B 开源软件
1
Real Time Recommendations using Spark Streaming
2022-03-13 10:45:43 1.46MB Real Time Spark Streaming
1
Hadoop streaming Hadoop为MapReduce提供了不同的API,可以方便我们使用不同的编程语言来使用MapReduce框架,而不是只局限于Java。这里要介绍的就是Hadoop streaming API。Hadoop streaming 使用Unix的standard streams作为我们mapreduce程序和MapReduce框架之间的接口。所以你可以用任何语言来编写MapReduce程序,只要该语言可以往standard input/output上进行读写。 streamming是天然适用于文字处理的(text processing),当然,也仅适用纯文本的
2022-03-10 13:59:21 65KB do hadoop hadoop开发环境搭建
1
Hadoop MapReduce Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架。Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上。 Why MapReduce? 1.海量数据在单机上处理因为硬件资源限制,无法胜任 2.而一旦将单机版程序扩展到集群来分布式运行,将极大增加程序的复杂度和开发难度 3.引入mapreduce框架后,开发人员可以将绝大部分工作集中在业务逻辑的开发上,而将分布式计算中的复杂性交由框架来处理 MapReduce编程规范 1.用户编写的程序分成三个部分:Mapper,Reducer,Driver(提交运行mr程序的客户端) 2.Mapper的输入数据是KV对的形式(KV的类型可自定义) 3.Mapper的输出数据是KV对的形式(K
2022-03-10 13:56:25 2.1MB Python
1