基于并行化直接解法的频率域可控源电磁三维正演
2022-05-02 10:04:12 5.51MB 文档资料
卷 积 神 经 网 络 (convolutional neural networks, CNN)是 深 度 学 习 技 术 应用最成熟的模型之一,卷积神经网络算法可以从原始输入中有效学习到高阶不变性的特征,利用卷积神经网络来提取特征进行目标识别和分析是当前 比 较 热 的 研 究 方 向 。 目 前 CNN 主 要 以 单 机 串 行 方 式 实 现 , 串 行 执 行 的CNN 算 法 存 在 一 些 缺 陷 :一 是 串 行 模 式 凸 显 出 训 练 时 间 过 长 ,算 法 内 在 并行性得不到发挥,内存不足等;二是伸缩性不足,在处理密集型数据效率不 高 。现 今 比 较 流 行 的 MapReduce 分 布 式 计 算 模 型 具 有 良 好 的 容 错 性 和 扩展 性 , 本 文 利 用 Hadoop 分 布 式 处 理 平 台 , 提 出 了 采 用 MapReduce 并 行 CNN 的 算 法 MRCNN。 并 在 MRCNN 算 法 基 础 上 持 续 进 行 优 化 , 提 出 利 用GPU 加 速 MRCNN 算 法
2022-04-24 09:06:35 2.31MB 算法 深度学习 数据结构 人工智能
1
multi_gpu_test 在多GPU机器上使用PyTorch进行并行化(已在Google Cloud GPU机器上测试) 设置带有一个或多个GPU的Google云机的脚本(要购买GPU机,请参阅以获取说明) Pytorch安装步骤/脚本 测试实用程序以检查多GPU执行 安装步骤 购买GPU机器后(有关说明,请参见 ) 运行first.sh-这将为后续步骤安装基本实用程序 运行second.sh-按照显示的链接中的说明获取Nvidia的驱动程序。 此存储库中提供了针对Ubuntu 16.04的安装(在second.sh中-默认情况下已注释) 使用nvidia_smi确认正确的安装 运行third.sh-这将安装anaconda,pytorch。 执行多GPU测试 conda激活伯特 python multi_gpu.py 请注意,这30个输入的批次分布在8个GPU上-7个G
2022-04-16 17:56:38 623KB Shell
1
本文介绍了关于有限域GF(2n)上的多精度整数的两种基本算法的并行算法。 通过分析其数据相关性,设计了归约运算和反乘运算的并行算法。 计算并行算法和顺序算法的时间复杂度以进行定量比较。 性能评估表明所提出的并行算法具有很高的效率。
1
卷积神经网络CNN的并行化研究 并行化 MapReduce框架 GPU加速
2022-04-06 16:33:33 5.3MB 卷积神经网络
1
目前,嵌入式多核处理器已经在嵌入式设备领域得到广泛运用,但嵌人式系统软件开发技术还停留在传统单核模式,并没有充分发挥多核处理器的性能。程序并行化优化目前在PC平台上有一定运用,但在嵌入式平台上还很少,另外,嵌入式多核处理器与PC平台多核处理器有很大不同,因此不能直接将PC平台的并行化优化方法应用到嵌人式平台。本文分别从任务并行和缓存优化两方面进行并行化优化的研究,探索在嵌人式多核处理器上对程序进行并行化优化的方法。   1 嵌入式多核处理器结构   嵌人式多核处理器的结构包括同构(Symmetric)和异构(Asymmetric)两种。同构是指内部核的结构是相同的,这种结构目前广泛应用在P
2022-03-16 22:28:35 390KB 嵌入式ARM多核处理器并行化方法
1
这是《高校云计算应用创新大赛》里的最后一道题,题目是莎士比亚文集词频统计并行化算法。由于原网站上的实验文件已经无法下载了,所以这里上传一份,包含 shakespear.zip、stopword.txt.
2022-03-15 16:07:47 1.96MB shakespear stopword
1
KMeans算法的并行化实验 KMeans算法的并行化实验 KMeans算法的并行化实验
2022-02-24 22:49:17 3KB KMeans 算法 并行化
1
4.K-最近邻(KNN)分类并行化算法 基本算法设计思想 K-最近邻是分类器算法中最通俗易懂的一种,计算测试样本到各训练样本的距离,取其中距离最小的K个,并根据这K个训练样本的标记进行投票得到测试样本的标记。 加权K-最近邻分类算法的思路是,在根据测试样本的标记进行投票表决时,将根据测试样本与每个训练样本间距离(或相似度)的大小决定训练样本标记的作用大小,基本原则是:距离越近的训练样本其标记的作用权重越大,反之则越小。据此,可以建立一个带加权的投票表决计算模型(比如y’ = ∑Si*yi/∑Si, k=[0,k-1],Si为取值0-1的相似度数值,yi为选取出的最邻近训练样本的分类标记值)决定以最终的测试样本的分类标记。 算法的思路清晰简单,然而对于海量数据计算量很大,耗费时间较长。
2021-12-25 13:22:33 24.75MB 大数据
1
什么样的计算任务可进行并行化计算? 并行计算的第一个重要问题是如何划分计算任务或者计算数据以便对划分的子任务或数据块同时进行计算。 但一些计算问题恰恰无法进行这样的划分! Nine women cannot have a baby in one month! 例如:Fibonacci函数: Fk+2 = Fk + Fk+1 前后数据项之间存在很强的依赖关系!只能串行计算! 结论:不可分拆的计算任务或相互间有依赖关系的数据无法进行并行计算!
2021-12-23 21:01:30 3.07MB MapReduce
1