计算前缀和 问题定义 n个元素{x1,x2,…,xn},前缀和是n个部分和: Si=x1*x2*…*xi, 1≤i≤n 这里*可以是+或× 串行算法: Si=Si-1*xi 计算时间为 O(n) 并行算法:p154算法6.9 SIMD-TC上非递归算法 令A[i]=xi, i=1~n, B[h,j]和C[h,j]为辅助数组(h=0~logn, j=1~n/2h) 数组B记录由叶到根正向遍历树中各结点的信息(求和) 数组C记录由根到叶反向遍历树中各结点的信息(播送前缀和)
2022-04-28 19:50:24 8.4MB 并行计算
1
为了解决大规模的应急系统中的物资调配的问题, 以时间性,效率性为优化目标, 建立了模糊目标集数学模型,给出了单事故点的优化算法;并提出了一个以应急事故点为中心对救援点进行聚类划分的方法,将复杂多事故点应 急调配的问题分解为单事故点来计算,把任务分配到不同处理器中并行执行. 实验结果表明, 基于多目标优化模型的并行算法大大地提高了应急调配解算速度,能为决策者提供更有效、快速、智能的服务.
1
可扩展并行计算技术、结构与编程,作者黄铠、徐志伟,pdf版
1
提出了一种基于GPU计算的3D模型直接切片技术,根据STL数据中三角面的法向量和顶点坐标进行并行着色,通过调整投影矩阵到切片高度来改变切片位置。 之后根据射线与三角面的交集结果输出截面二值图。 最后利用MS算法完成轮廓数据提取。 该算法不需要对三角形进行排序和删除,结合GPU的并发性来缩短轮廓提取时间。
2022-04-22 17:05:39 3.23MB 矩阵 3d 算法 线性代数
在matlab中调用CUDA(*cu文件)调用工具 The Zip file contains five files · nvmex.pl – copy this file to the MATLAB “bin” directory · nvmex_helper.m · nvmex.m · nvmexopts.bat - for MATLAB versions 2007 and up · nvmexopts_old.bat - for pre-2007 MATLAB versions Invoke the nvmex command from inside MATLAB to compile .cu files
2022-04-20 12:11:22 30KB CUDA matlab 并行计算
1
matlab开发-单炮IUSB6008DAQ。单次NI-USB6008数据采集
2022-04-19 15:28:47 2KB 并行计算
1
本书介绍目前最常见的并行程序—MPI并行程序的设计方法它适合高校三四年级本科 生非计算机专业研究生作为教材和教学自学参考书也适合于广大的并行计算高性能计 算用户作为自学参考书使用对于有FORTRAN和C编程经验的人员都可以阅读并掌握 本书的内容
2022-04-19 11:49:01 930KB 并行计算 mpich2 分布式计算 并行编程
1
此文件为中国科学院大学高性能计算课程迟学斌老师课件,高屋建瓴的讲述了高性能计算的基础问题,提供了此方面入门的良好的敲门砖,希望能对大家有用
2022-04-16 18:01:33 1.89MB 中科院 高性能 并行计算
1
为解决点源法计算全息速度较慢的问题,提出了一种新的查表算法,命名为三角函数查表法(T-LUT算法)。该算法是基于点源法基本的数学公式,通过一系列数学近似与恒等变换,生成了一种纯相位查找表,该查找表具有三维特性,并具有生成速度快、精度高、占用内存少等特点,克服了点源法重复计算相位的缺点。同时采用统一计算设备架构(CUDA)并行计算在图形处理器(GPU)上加以实现,并进行了三次并行优化。在算法的验证与对比实验中,采用单显卡(GPU显卡)实现T-LUT算法,在不牺牲全息图再现像质量的前提下,成功地将点源法计算全息的速度大幅度提升。实验发现在不同的物空间采样点数量的情况下,速度相对于点源法GPU 运算提升30倍至近千倍不等。
2022-04-16 14:12:31 3.51MB 全息 三角函数 查表法 统一计算
1
MPICH2是MPI(Message-Passing Interface)的一个应用实现,支持最新的MPI-2接口标准,是用于并行运算的工具,在程序设计语言上支持C/C++和Fortran。
2022-04-14 15:59:20 8.42MB mpi 并行计算
1