经典教材及参考书,英文版parallel distributed simulation system 作者Richard M. Fujimoto,本领域必看的专业书籍
2022-06-19 22:39:22 2.33MB 分布式 并行 系统
1
计算机组成与结构:lecture 17 Parallel Processing.pdf
2022-06-14 14:01:05 376KB 计算机 互联网 文档
ansys与matlab代码并行 Ansys 从并行批处理模式运行 代码: Ansys APDL、Matlab 看 示例:parallel_ansys_test.m 和 /Ansys/frame_test Matlab/parallel_ansys/parallel_ansys.m 帮助文件/序言 代码的工作 形成具有“n”个作业数的块(要并行运行),从第一个块开始 在主 Ansys 工作文件夹中为并行作业创建临时文件夹:/job1_tmp、/job2_tmp、...、/job'n'_tmp 并行运行“n”个作业/分析并将请求的结果保存到相应的文件夹 收集请求的结果并将其复制到主 Ansys 工作文件夹 删除临时作业文件夹 转到步骤 1. 并移动到下一个块(如果有) 致谢 本 repo 中的脚本是在布达佩斯科技经济大学开发的。 我的其他 Ansys 相关存储库
2022-06-09 17:04:05 14KB 系统开源
1
Product Version 15.1 October 2015
2022-06-09 16:47:33 3.42MB spectre
1
•Intel® Parallel Studio XE 2015 Update 5 Cluster Edition 的license,当然也适用于2015Cluster的各个版本。
2022-06-01 09:27:11 623B Intel Parallel Studio Cluster
1
并行TensorFlow DataLoader 这个简单的项目旨在并行加载数据(尤其是视频数据)以提高整个系统的效率。该框架如下所示: 我们派生$ K $线程来加载和解码CPU中的数据,并维护一个全局FIFO队列来存储数据。 需要一个主要任务线程在GPU中训练网络。 如果加载批处理数据的时间大于在GPU中进行训练的时间,则效率将大大提高。 仿真实验结果如下所示(加载一批数据的时间设置为1秒,一步训练的时间设置为0.2秒): 图1:串行加载数据,CPU使用率仅为5.3% 图2:派生10个线程来加载数据,CPU使用率接近30%,几乎是串行版本的6倍。 无花果3:分叉30个线程来加载数据 中文博客,网址为 。
2022-05-25 14:38:14 29KB Python
1
Parallel-META 2.0:具有功能注释,高性能计算和高级可视化功能的增强型元基因组数据分析
2022-05-21 00:46:32 1.72MB 研究论文
1
近年来,Internet的发展使全球数据量快速增长,大数据时代的到来给传统计算带来了巨大挑战。 大数据系统(例如hadoop,spark)正成为处理大数据的重要平台,但是由于大数据应用程序本身的设计缺陷以及不合理的分布式框架配置,因此难以实现大数据系统中应用程序的性能。计算机理论的最高速度,因此如何定位大数据系统的性能瓶颈并分析瓶颈原因。值得研究。 本文提出了大数据系统的5层性能评估模型,为性能分析提供了可靠的基础,同时,提出了大数据系统的性能优化模型,可以弥补性能瓶颈。位置和瓶颈分析,并进一步优化性能。 基于这两个性能模型,实现了一个基于事件的性能工具来分析性能数据。 实验结果表明,这两个性能模型对大数据系统的性能评估和优化有效,可将大数据系统的平均运行时间缩短19%。
2022-05-20 15:27:53 523KB Parallel Program; Performance Model;
1
并行 C 程序 挪威科技大学并行计算课程中的练习。 介绍 作为对 C 的简单介绍以帮助我们入门,本练习在 C 中实现了一些与矩阵相关的计算。 区域随着 MPI 增长 在这个练习和以下许多练习中,我们被要求解决一个区域增长问题。 问题如下。 您有一个二维像素网格,每个像素都有一个灰度颜色(0 到 255 之间的一个字节)。 给定一个阈值和一些位置(种子),如果颜色差异低于阈值,您将把种子“生长”到相邻像素。 继续扩大该地区,直到它不再增长。 在本练习中,我们将使用MPI实现它, MPI是一种用于并行计算的消息传递协议。 串行优化 引用练习:“在这个问题中,你应该编写一个函数来尽可能快地执行稀疏矩阵向量乘法。你应该通过在文件 spmv.c 中实现乘法函数来做到这一点。你的函数应该比包含的函数更快乘以天真。您可以使用 struct s 矩阵 t 创建自己的稀疏矩阵格式。” 使用 pth
2022-05-15 22:07:18 956KB C
1
具有并行计算的卷积神经网络的C ++库(openMP,CUDA,MPI) 用法: g ++ -std = c ++ 11 -fopenmp lenet.cpp -o lenet ./lenet 这是模型的多线程版本(具有数据并行性),您可以使用以下方法更改线程数: 导出OMP_NUM_THREADS = 4 要使用MPI版本的代码,您需要使用mpic ++进行编译: mpic ++ -std = c ++ 11 -fopenmp lenet.cpp -o lenet 您可以在多节点系统上运行它! 创建自己的网络 您可以通过派生Model类并使用addLayer()方法按顺序添加所有图层来创建自己的深度神经网络类。 您还可以通过扩展ActivationLayer来引入自己的激活层。 您可以通过扩展LossFunction类来创建自定义Loss函数。 工作正在进行中 使用以下方法进
2022-05-13 18:00:15 10.98MB C++
1