Alink在微博机器学习平台中的实践.pdf
2022-05-12 21:37:24 1.81MB 机器学习 人工智能
随着云计算与分布式集群技术的发展,大数据概念在容量、价值等方面都有 了更广的扩展和延伸,机器学习技术近年来也得到了前所未有的重视。本文主要 针对传统数据挖掘算法无法处理海量数据,近年来比较流行的MapReduce对机 器学习算法不能有效并行化运行等问题,提出基于Spark来构建一个用于大规模 机器学习的平台,该平台不仅能够兼容Hadoop集群利用现有计算资源灵活高效 地处理海量数据,而且还具有良好的可扩展性,能够满足各类机器学习任务场景 的需求。 本文完成了如下几个方面的工作: 论文主要针对机器学习任务中的常见场景,基于Spark平台设计和实现了其 中经典的算法,包括并行化的线性回归、支持向量机、KMeans聚类算法,基于 图计算模型抽象的矩阵分解、PageRank算法,以及数据流KMeans聚类算法。 算法工作均以大规模机器学习的相关基础理论为有效支持,充分体现平台的运行 效率和可扩展性; 在算法设计过程中,本文针对大数据场景对经典算法进行一些改进优化工作。 例如,基于集成学习理论方法,采用Bagging策略来提高模型的稳定性;为了提 升计算效率,引入了基于采样的子梯度模型优化方法;
2022-04-29 10:05:37 117.49MB spark 机器学习 文档资料 大数据
对机器学 习 任务中 的 常见场景, 基于 平台设计和实现了 其 中经典 的算法 , 包括并行化的线性 回 归 、 支持 向量机 、 聚类算法 , 基于 图计算模型抽象 的矩阵分解 、 算法 , 以及数据流 聚类算法 。 算法工作均 以大规模机器学习 的相 关基础理论为有效支持 , 充分体现平台的运行 效率和可扩展性 ;
2021-11-05 19:25:45 12.03MB 机器学习 spark
1
阿里云高级产品专家刘吉哲在2017广州云栖大会中做了题为《阿里云机器学习平台 PAI 产品与技术》的分享,就机器学习应用场景,阿里云机器学习 PAI ,技术框架解析等方面的内容做了深入的分析。
2021-10-01 17:35:45 16.98MB 大数据和人工智能
1
CMU-Multimodal SDK版本1.2.0(mmsdk) CMU-Multimodal SDK提供了一些工具,可以轻松加载知名的多峰数据集并快速构建神经多峰深度模型。 因此,SDK包含两个模块:1)mmdatasdk:使用计算序列下载和处理多峰数据集的模块。 2)mmmodelsdk:利用复杂神经模型以及用于构建新模型的层的工具。 先前论文中的融合模型将在这里发布。 这里的所有数据集都是使用SDK处理的(甚至是使用SDK V0的old_processed_data文件夹)。 您可以通过在数据集上调用以下函数来获取项目中使用的计算序列的引用: >> > mydataset . bib_citations ( open ( 'mydataset.bib' , 'w' )) >> > mycompseq . bib_citations ( open ( 'mycompseq.bib
2021-09-10 10:51:12 307KB sdk dataset alignment multimodal-datasets
1
在我博客有详细安装教程,python脑电信号机器学习分类的平台搭建,基于VSCODE,python3.7.9,安装调试教程,numpy-1.19.4+mkl-cp37-cp37m-win_amd64,脑电信号机器学习分类代码一份(包括数据和代码,可运行)
2021-08-25 09:03:00 323.25MB 脑电信号 机器学习 平台搭建 入门教程
小而美的机器学习平台实践_谭孟泷@转转.pdf
2021-08-24 11:02:59 1.2MB 机器学习
一份非常好的资料用于指导机器学习平台如何建设!
2021-04-23 17:04:37 1.36MB 机器学习平台 人工智能 大数据平台
awesome-h2o:使用H2O机器学习平台构建的研究,应用和项目的精选清单
1