Intel Parallel Studio XE 2020 Update4 Windows/Linux/Mac 百度网盘下载链接
1
针对矢量线可视化中的数据输入/输出瓶颈, 提出一种大规模流场矢量线可视化的数据预取方法. 首先将规模流场数据划分为若干数据块; 在预处理阶段统计数据块间以及数据块各边界间的粒子流向, 并构造数据块间粒子流向概率图和数据块边界间粒子流向概率图.在进行矢量线计算时, 利用粒子流向概率图预测粒子流向预取数据块. 实验结果表明, 相比已有的数据预取方法, 该方法进行数据预取的命中率和数据满足率提高 10%~25%, 可以有效地提高大规模流场矢量线可视化的效率.
1
数字化远程Loran-C信号传播的建模非常困难,因为它的计算成本非常高。 由于不可避免的近似,其他分析/半分析方法不够准确。 在这项研究中,作者提出了一种使用自适应移动窗口时域有限差分(FDTD)方法计算统一设备架构并行计算技术的解决方案。 窗口的移动速度自适应地取决于波速。 为了实现自适应移动窗口技术,首先将原始的Loran-C信号截断。 提出了用于提取电场幅度和相位的另一种方法。 随着FDTD更新,可以从空间域同步获取计算空间中每个网格的电场幅度和相位数据,而无需在时域进行额外的存储成本和后处理。 通过所有这些努力,在22分钟内成功模拟了400 km的传播路径。 采取了江西省晋县和上饶之间的测量结果来验证数值方法。
2021-03-02 21:05:48 2.16MB 研究论文
1
用cuda实现的3×3中值滤波,排序算法为二分法,利用共享内存,巧妙加速,算法执行效率非常高。 下载后带入数据直接用。
2021-03-02 20:02:23 3KB cuda 中值滤波 并行计算
包含一些内容 GPU与加速计算 MPI编程 OpenMP编程 并行程序性能优化 并行程序模型 并行和优化案例 高性能计算概述
2021-03-02 14:49:24 52.39MB GPU加速 并行计算 高性能计算
1
无论什么样的并行计算方式,其终极目的都是为了有效利用多机多核的计算能力,并能灵活满足各种需求。相对于传统基于单机编写的运行程序,如果使用该方式改写为多机并行程序,能够充分利用多机多核cpu的资源,使得运行效率得到大幅度提升,那么这是一个好的靠谱的并行计算方式,反之,又难使用又难直接看出并行计算优势,还要耗费大量学习成本,那就不是一个好的方式。由于并行计算在互联网应用的业务场景都比较复杂,如海量数据商品搜索、广告点击算法、用户行为挖掘,关联推荐模型等等,如果以真实场景举例,初学者很容易被业务本身的复杂度绕晕了头。因此,我们需要一个通俗易懂的例子来直接看到并行计算的优势。数字排列组合是个经典的算法
1
并行计算导论 第2版An Introduction to Parallel Programming英文第1、2版,中文第2版。
2021-02-26 19:37:24 54.68MB 并行计算导论 An Introduction
1
GPU并行计算加速的实时可视外壳三维重建及其虚实交互
2021-02-26 16:06:57 2MB 研究论文
1
关于MPI、并行计算的总结对比,目录如下: 1. 并行计算 1.1. 相关背景 1.2. 什么是并行计算 1.3. 主要目的 1.4. 并行计算与分布式计算 1.5. 并行的基本条件 1.6. 主要的并行系统 1.6.1. 共享内存模型 1.6.2. 消息传递模型 1.6.3. 数据并行模型 1.6.4. 对比分析 2. MPI 2.1. 什么是MPI 2.2. MPI的实现 2.3. MPI基本函数 2.4. MPI功能特点 2.5. 技术对比分析 2.5.1. 共享内存模型(以OpenMP为例) 2.5.2. 分布式内存模型 2.6. 小结 3. 问题解释 3.1. 并行计算和MPI是什么关系?为了实现并行计算,是否使用MPI技术即可实现? 3.2. MPI技术原理是什么,即基础设施提供什么样的支持能力? 3.3. 为了实现并行计算,应用软件需要什么样的特殊设计 3.4. 什么样的软件需要并行计算 4. 部分参考资料
2021-02-26 15:45:45 669KB MPI 并行计算 分布式计算
1
NUMBA开源编译把常用FOR循环变成并行计算的3个例子。包含利用CPU,GPU的方式。有需要的同学可以参考。
2021-02-23 14:04:24 117KB GPU 并行计算
1