使用 Spark 进行响应式 Web 日志挖掘
Web 日志分析基于符合 W3C Web 服务器日志格式的日志文件。 IIS 是支持这种格式的主要候选者。 挖掘功能本身不限于这种格式,可以通过更改配置参数轻松适应其他日志文件。
此处使用 Web Log Mining 来提取常见的 Web 分析参数。
项目将与 Spark 集成在一起,例如使用马尔可夫模型预测客户参与事件的购买范围。 这些模型还可以应用于来自 W3C 网络服务器日志的数据,以预测有价值的参数。
Web日志微服务
该项目实现了基于 Akka Remoting 的微服务,因此可以轻松集成到任何基于 Akka 的松耦合环境中。 这种架构方法为分布式数据处理系统带来了 Spark 的强大功能。
Akka 是一个使用构建并发可扩展应用程序的工具包。 Akka 带有一个称为Akka Remoting的功能,它可以轻松地以对等方式
2021-10-30 10:20:30
114KB
Scala
1