DBSCAN分布式
DBSCAN集群算法的Scala + Spark实现
编译软件
下载和环境设置
首先在本地克隆存储库
git clone https://github.com/AlecioP/DBSCAN-distributed
然后移至本地存储库
cd DBSCAN-distributed
为了构建可以在EMR集群上远程执行的jar文件,我们使用包管理器(类似于MAVEN的JAVA和SCALA的包管理器)
要安装sbt,您必须已安装 ,请运行:
MACOS brew install openjdk
如果您没有安装
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) "
UBUNTU sudo apt-get install ope
2021-11-29 16:59:21
2.43MB
Scala
1