上传者: 42152901
|
上传时间: 2022-05-06 18:12:31
|
文件大小: 20KB
|
文件类型: DOCX
1. 训练要点
(1) 使用socket连接方式获取数据源。
(2) DStream的转换操作。
2. 需求说明
从一台服务器的8888端口上收到一个以换行符为分隔符的多行文本,要从中筛选出包含单词error的记录,并把它打印出来。
3. 实现步骤
(1) 启动Spark独立集群模式并启动spark-shell。
spark-shell –master local[2]