在很多真实应用中,数据以流的形式不断被收集得到.由于数据收集环境往往发生动态变化,流数据的分布也会随时间不断变化.传统的机器学习技术依赖于数据独立同分布假设,因而在这类分布变化的流数据学习问题上难以奏效.
2021-01-31 14:18:44 1.74MB 流数据学习
1
SparkStreaming是Spark核心API的扩展,用于可伸缩、高吞吐量、可容错地处理在线流数据。Spark Streaming可以从很多数据源获取数据,比如:Kafka、Flume、Twitter、ZeroMQ、Kinesis或TCP连接等,并可以用很多高层算子(map/reduce/join/window等)来方便地处理这些数据。最后处理过的数据还可以推送到文件系统、数据库和在线监控页面等。实际上,你也可以在数据流上使用Spark的机器学习和图计算算法。SparkStreaming内部工作机制概图如下所示。Spark
1
linux实验环境,storm搭建完毕后的开发。eclipse开发环境,大数据界hello world——wordcount详解,bolt、分组机制、storm DRPC详解
2021-01-28 04:32:46 11.44MB storm 实时数据分析
1
Apache Storm是一个分布式实时大数据处理系统。Storm设计用于在容错和水平可扩展方法中处理大量数据。它是一个流数据框架,具有最高的摄取率。虽然Storm是无状态的,它通过Apache ZooKeeper管理分布式环境和集群状态。它很简单,您可以并行地对实时数据执行各种操作。”
1
CluStream流数据聚类 java 代码和jar包 CluStream是两层结构 分为在线聚类和离线聚类两部分
2020-01-03 11:36:38 724KB CluStream java 聚类 流数据
1
C# NAudio录音和播放音频文件-实时绘制音频波形图(从音频流数据获取,而非设备获取)(播放音频时可能没声音,把代码中Volume=0注释或修改值即可)
2019-12-21 20:32:23 3.01MB C#绘制音频波形图 NAudio绘制波形图
1
小区间OD矩阵的预测工具,输入一已知的数据流可进行自动迭代推算,误差默认设置为0.001.
2019-12-21 20:27:28 255KB 数据预测
1
Databricks Spark Reference Applications spar日志分析、流数据处理 java8代码
2019-12-21 20:25:32 556KB spark
1
Real-Time Analytics: Techniques to Analyze and Visualize Streaming Data 实时分析-分析和可视化流数据的技术.pdf 包括Storm、samza、kafaka、flume等技术.
2019-12-21 20:25:32 3.57MB spark storm
1
C# 流数据旋转90度 图像旋转90度 包括顺时针和逆时针旋转
2019-12-21 20:19:56 1KB C# 流数据旋转 90度 图像旋转
1