只为小站
首页
域名查询
文件下载
登录
基于
OpenMP
的Winograd并行矩阵乘算法应用研究 (2012年)
为了提高半经典分子动力学模拟中矩阵乘法效率, 通过一种稀疏矩阵分解方法化简矩阵乘法, 基于
OpenMP
实现矩阵相乘的Winograd并行算法。该算法将Winograd算法中各部分依次采用
OpenMP
并行计算, 降低了数据通信。在16核服务器上测试表明, 该方法能够显著提高半经典分子动力学模拟中矩阵乘法效率, 并行加速比能够达到9. 47, 并具有良好的可扩展性, 为大分子体系的模拟提供了可能。
2022-06-01 14:05:21
471KB
工程技术
论文
1
MPI+
OpenMP
.zip
并行计算机架构与编程上机实验程序 求矩阵行列式MPI+
OpenMP
多线程编程 MPI+
OpenMP
多线程编程的PBS
2022-05-30 14:51:43
2KB
MPI+OpenMP多线程编程
并行计算编程
1
libiomp5.dylib
macOS中Xcode搭建
OpenMP
必备文件
2022-05-23 17:04:47
1.49MB
xcode
macos
OpenMP
1
parallel-c-programs:大量使用 CUDA、OpenCL、MPI、
OpenMP
和 pthreads 的并行程序
并行 C 程序 挪威科技大学并行计算课程中的练习。 介绍 作为对 C 的简单介绍以帮助我们入门,本练习在 C 中实现了一些与矩阵相关的计算。 区域随着 MPI 增长 在这个练习和以下许多练习中,我们被要求解决一个区域增长问题。 问题如下。 您有一个二维像素网格,每个像素都有一个灰度颜色(0 到 255 之间的一个字节)。 给定一个阈值和一些位置(种子),如果颜色差异低于阈值,您将把种子“生长”到相邻像素。 继续扩大该地区,直到它不再增长。 在本练习中,我们将使用MPI实现它, MPI是一种用于并行计算的消息传递协议。 串行优化 引用练习:“在这个问题中,你应该编写一个函数来尽可能快地执行稀疏矩阵向量乘法。你应该通过在文件 spmv.c 中实现乘法函数来做到这一点。你的函数应该比包含的函数更快乘以天真。您可以使用 struct s 矩阵 t 创建自己的稀疏矩阵格式。” 使用 pth
2022-05-15 22:07:18
956KB
C
1
OpenMP
并行计算程序例子
OpenMP
并行计算例子,主要包括简单例子、并行循环、常用函数、分段并行、嵌套并行、求π以及同步这些例子。所有例子都已经过测试。
2022-05-14 12:12:03
14.03MB
OpenMP例子
openmp并行编
openmp运行脚
1
Parallel-Convolutional-Networks:具有并行计算的深度卷积神经网络的C ++库(
openMP
,CUDA和MPI)
具有并行计算的卷积神经网络的C ++库(
openMP
,CUDA,MPI) 用法: g ++ -std = c ++ 11 -f
openmp
lenet.cpp -o lenet ./lenet 这是模型的多线程版本(具有数据并行性),您可以使用以下方法更改线程数: 导出OMP_NUM_THREADS = 4 要使用MPI版本的代码,您需要使用mpic ++进行编译: mpic ++ -std = c ++ 11 -f
openmp
lenet.cpp -o lenet 您可以在多节点系统上运行它! 创建自己的网络 您可以通过派生Model类并使用addLayer()方法按顺序添加所有图层来创建自己的深度神经网络类。 您还可以通过扩展ActivationLayer来引入自己的激活层。 您可以通过扩展LossFunction类来创建自定义Loss函数。 工作正在进行中 使用以下方法进
2022-05-13 18:00:15
10.98MB
C++
1
运用
OpenMP
和CUDA优化蒙特卡洛算法.doc
运用
OpenMP
和CUDA优化蒙特卡洛算法.doc
2022-05-13 09:06:56
2.33MB
算法
文档资料
OPenMp
多核编程
OPenMp
多核编程命令详解包括:
OpenMP
简介,基本语法,以及相关练习
2022-05-09 23:36:48
455KB
多核
openmp
1
Distributed Multithread Apriori (DMTA):使用MPI和
OpenMP
到Apriori算法的并行实现-开源
DMTA(分布式多线程Apriori)是Apriori算法的并行实现,该算法在线程和进程级别利用并行性,以寻求在内核之间执行负载平衡。 使用并行化库
OpenMP
和MPI以C ++语言实现。 该算法是由AndréCamilo Bolina在拉夫拉斯联邦大学计算机科学系的Marluce Rodrigues Pereira,Ahmed Ali Abdalla Esmin和Denilson Alves Pereira老师的指导下开发的项目所产生的。 该项目的结果已发布在FSMA信息系统杂志上,并可在http://www.fsma.edu.br/si/edicao11/FSMA_SI_2013_1_Principal_1.html中获得。
2022-05-07 22:22:29
5KB
开源软件
1
并行算法实践-MPI和
OPENMP
混合编程详解
并行算法实践
2022-05-04 22:23:55
993KB
MPI
OPENMP
混合编程
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Python+OpenCV实现行人检测(含配置说明)
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
大唐杯资料+题库(移动通信)
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
Android大作业——网上购物APP(一定是你想要的)
Android小项目——新闻APP(源码)
王万良-人工智能导论(第五版)课件
BP神经网络+PID控制simulink仿真
2019年秋招—华为硬件工程师笔试题目.pdf
C4.5决策树算法的Python代码和数据样本
夏天IC助手1.8你们懂的
多机器人编队及避障仿真算法.zip
IEEE 39节点系统的Simulink模型
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
最新下载
关于javaweb课程设计之通讯管理系统
javaweb版的个人通信录系统
中文短信数据集-带标签
pycuda-2021.1+cuda102-cp38-cp38-win_amd64.whl
Access开发通用界面百变加强版
Inspect-x64.zip
FreeGame.lua
RouterOS 6.44.2 L5 2G vmxnet3
CISPR 25 2021
Android秒表安卓APP开发源代码
其他资源
phoenix-5.0.0.3.0.0.0-1634.tar.gz
labelme -图像标注工具window系统-支持win10
编译原理大作业完整的词法分析器
ZUC算法原理说明及程序代码
基于Android的在线播放器系统的设计与实现
opengl导入FBX模型代码
数据库系统概念第六版ppt
android全国城市高校选择源码
md文件查看(typora).zip
CrystalQuickReferenceGuide[1].pdf
FFmpeg 2020.08.28.7z
相当好用的OCR图片文字提取工具
遥测数据地面网络化传输系统的设计与应用
易人信封打印软件 v4.5.rar
Fourier Transform – Signal Processing(傅里叶变换-信号处理)
java socket 视频流转发socket
ansya workbench 模态分析 part1
基于asp.net在线报名系统
广联达ID获取工具
高级后台管理模板
QT闹钟alarm
数据库原理及应用(何玉洁)第二版
全国矢量数据图大全和真实三维地形构建