(DL4J)生态系统是一组项目,旨在满足基于JVM的深度学习应用程序的所有需求。 这意味着从原始数据开始,从任何位置以任何格式加载和预处理原始数据,以构建和调整各种简单和复杂的深度学习网络。 由于Deeplearning4J在JVM上运行,因此您可以将其与Java以外的各种基于JVM的语言一起使用,例如Scala,Kotlin,Clojure等。 DL4J堆栈包括: DL4J :高级API,用于构建具有各种层(包括自定义层)的MultiLayerNetworks和ComputationGraphs。 支持从h5导入Keras模型,包括tf.keras模型(从1.0.0-beta7开始),还支持在Apache Spark上进行分布式培训 ND4J :通用线性代数库,具有500多种数学,线性代数和深度学习运算。 ND4J基于高度优化的C ++代码库LibND4J,它通过OpenBLAS,OneDNN(MKL-DNN),cuDNN,cuBLAS等库提供对CPU(AVX2 / 512)和GPU(CUDA)的支持和加速。 SameDiff :ND4J库的一部分,SameDiff是我们的自
2022-01-14 17:49:18 61.65MB python java clojure scala
1
浪潮内部的大数据技术培训PPT,涵盖了hadoop和spark技术体系。
2022-01-13 10:42:49 7.28MB hadoop spark hive hbase
1
Databricks推荐的Spark GraphX库的入门学习资料。原书共7章,这里翻译了前4章。后面几章有时间的话可能会继续,可以关注我的blog了解进度,但不保证哈~。昨晚上传了一版后发现保存后的目录乱的很,这是修改过的,重新上传。
2022-01-12 15:21:14 1.78MB Spark Graph GraphX Databricks
1
(最终版)大数据Hadoop与Spark学习经验谈.pdf
2022-01-12 14:12:49 5.23MB hadoop spark
1
本文首先对决策树算法的原理进行分析并指出其存在的问题,进而介绍随机森林算法。同单机环境下的随机森林构造不同的是,分布式环境下的决策树构建如果不进行优化的话,会带来大量的网络IO操作,算法效率将非常低,为此本文给出了随机森林在分布式环境下的具体优化策略,然后对其源码进行分析,最后通过案例介绍随机森林在金融领域内如何进行优质客户的分类。Spark内存计算框架在大数据处理领域内占有举足轻重的地位,2014年Spark风靡IT界,Twitter数据显示Spark已经超越Hadoop、Yarn等技术,成为大数据处理领域中最热门的技术,如图1所示。2015年6月17日,IBM宣布它的“百万数据工程师计划”
1
Apache Spark Kinesis使用者 使用Apache Spark使用AWS Kinesis流化并将数据保存在Amazon Redshift上的示例项目 来自以下内容的代码: 用法示例 您需要在您的环境上设置Amazon Credentials。 export AWS_ACCESS_KEY_ID= " " export AWS_ACCESS_KEY= " " export AWS_SECRET_ACCESS_KEY= " " export AWS_SECRET_KEY= " " 依存关系 必须包含在--packages标志中。 org.apache.spark:spark-streaming-kinesis-asl_2.10:1.6.1 设置 如何在本地运行Kinesis? 几个月前,我使用Kinesalite(amazin项目来模拟Amazon Kinesis)创建了
2022-01-11 11:08:00 24KB python shell aws spark
1
大数据spark,大数据大数据大数据大数据大数据大数据大数据大数据大数据
2022-01-10 20:42:22 215.65MB hadoop
1
适合大数据spark初学者
2022-01-10 09:18:16 22KB spark u.user
1
使用spark sql模拟带倒排索引的简单搜索引擎演示: :
2022-01-09 19:12:00 3KB Python
1
分析Zenvisage在时序大数据的应用场景下存储和查询性能下降的问题,找到传统关系型数据库在时序大数据分析中的瓶颈
2022-01-08 20:44:25 2.22MB 大数据可视化 Spark Hadoop Parquet
1