随机森林 这是 Spark 上随机森林算法的分布式实现。 这与 mllib 中可用的相同算法的实现不同。 在 mllib 中,随机森林算法是通过明智地拆分数据实例来实现的。 此实现是通过明智地拆分数据特征。 这种实现对于具有许多特征的数据非常有用。 我也做了一些即兴创作,删除了一些在这种实现方法中可以避免的类。 一个重要的改进是:现在,randomForest 的用户不需要提供 categoricalFeatureInfo(关于哪些是连续特征,一个分类特征包含多少类别的信息)作为输入。它现在被转换为一个 Option 这个实现会自动检测哪些是连续特征连续特征以及当 categoricalFeatureInfo 在用户输入中被指定为 None 时,分类特征包含多少个类别。
2022-06-04 03:47:54 1.02MB Scala
1
java语言编写的具有模拟环境温度,socket通信,多线程处理,日志记录等功能的空调从控机,代码原创
2022-06-03 22:04:29 12KB java socket 线程
1
高斯分布的历史由来和发展
2022-06-03 19:06:23 838KB 综合资源
1
ChinaKM2020网格GDP分布数据集 ChinaKM2020网格GDP分布数据集 ChinaKM2020网格GDP分布数据集 ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集ChinaKM2020网格GDP分布数据集
2022-06-03 14:40:07 7.82MB GDP 2020 网格 分布
1
论文研究-威布尔分布无失效数据的Bayes可靠性分析.pdf,
2022-06-03 13:58:14 182KB 论文研究
1
CAP理论与分布式数据库
2022-06-03 11:03:38 223KB 文档资料 分布式 数据库 database
ddb1分布式数据库系统及其应用
2022-06-03 11:03:03 3.14MB 分布式 数据库 database
基于大数据分析的分布式MOLAP技术研究.docx
2022-06-03 09:01:08 25KB 互联网
java大型项目源码下载 GeoMesa 是一个开源工具套件,可在分布式计算系统上实现大规模地理空间查询和分析。 GeoMesa 在 Accumulo、HBase、Google Bigtable 和 Cassandra 数据库之上提供时空索引,用于点、线和多边形数据的海量存储。 GeoMesa 还通过在 Apache Kafka 之上分层空间语义来提供时空数据的近实时流处理。 通过 GeoServer,GeoMesa 通过标准 OGC(开放地理空间联盟)API 和协议(如 WFS 和 WMS)促进与各种现有地图客户端的集成。 GeoMesa 支持 Apache Spark 进行自定义分布式地理空间分析。 GeoMesa 是 Eclipse 基金会工作组的成员。 加入社区 GeoMesa 和邮件列表 用于问题跟踪的 GeoMesa 文档 快速入门: | | | | | 下载 当前的版本: | | | | | | 验证下载 GitHub 上托管的下载包括 SHA-256 哈希和 gpg 签名(.asc 文件)。 要使用 gpg 验证下载,请导入相应的密钥: $ gpg2 --keyserv
2022-06-02 22:16:41 24.11MB 系统开源
1
Linux运维-4.服务管理-003DNS服务-2视频-033分布式DNS模型.avi
2022-06-02 22:00:54 167.56MB 运维 linux 3d 音视频