搜索【Gpu】的结果

使用 GPU Coder 使用 YOLO v2 进行实时对象检测：在 NVIDIA GPU 上使用 YOLO v2 进行实时对象检测的示例-matlab开发

您可以将 GPU Coder:trade_mark: 与 Deep Learning Toolbox:trade_mark: 结合使用，在使用 NVIDIA:registered: Jetson 和 Drive 平台的嵌入式平台上生成代码并部署深度学习网络。即使没有神经网络、深度学习或高级计算机视觉算法方面的专业知识，预训练的网络和示例（例如对象检测、图像分类和驾驶员辅助应用程序）也可以轻松使用 GPU Coder 进行深度学习。我们从 MATLAB 中已发布的示例开始，该示例解释了如何训练 YOLO v2 对象检测器，并使用 GPU Coder:trade_mark: 生成优化的 CUDA 代码，并使用适用于 NVIDIA:registered: GPU 的硬件支持包，将生成的代码部署到 Jetson Xavier板作为一个独立的应用程序。下载包含可用于生成代码的附加脚本和函数。有关 MATLAB 中的示例和所有必需文件，请参阅以下文档链接：使用YOLO v2深度学习进行对象检测：

2022-05-13 20:48:51 92KB matlab

1

Book_CUDA并行程序设计-GPU编程指南中英文完整版2014年

CUDA Programming，中文名：CUDA并行程序设计-GPU编程指南 2014年含书签，高清。

2022-05-13 10:56:03 143.79MB cuda GPU编程

1

mic与gpu对比

mic与gpu对比,GPGPU与MIC定位相似，两者都是相对于CPU具有较高性价比的高性能解决方案，甚至连外形都是一样使用PCI-E插槽的板卡。但对于“核”这个概念来说，两者却有很大的不同。GPGPU中所说的核，以CUDA为例，是指一个SP（即流处理器），SP的功能只有计算，以NVIDIA的Fermi GPU为例，32个SP组成一个SM（流处理器群），一个SM 才有两个控制单元。也就是说每16个GPU的“核”，必须执行同一条指令。而MIC得设计思路与GPGPU完全不同。MIC的每个“核”，可以简单看作一个X86核心，也就是与现有PC机或小型服务器上的CPU核心相同的核。因此MIC编程可以最大限度地沿袭已有CPU上的并行程序，甚至可以一定程度上认为MIC上的每个“核”都是独立的节点，亦即将MIC作为一个超小型的集群。MIC的“核”虽然是x86架构，虽然单核的功能比GPGPU的核强大不少，但要指望单兵作战接近主流CPU，暂时还是不现实的。MIC依靠和GPGPU一样，靠人海战术。说起“人数”，GPGPU动辄上百核，MIC只有几十核，几十单核性能再强，在并行应用中也掀不起多少浪花。由于MIC的核心是Intel的CPU，核心数即使上不去了，Intel处理器可以超线程。在MIC上，每个核心能同时并发执行4个线程，而且这4个线程被Intel成为“硬件线程”，其性能大幅提升，几乎可以把每个线程看作真正的核心。因此，MIC“执行核”的数量，核GPGPU实际差不多。另外，MIC采用了SMP结构，以一致性共享缓存为中心，这种设计使得MIC可以使用传统CPU的编程模型，而不需要针对性的硬件，设计新的程序结构。 MIC对现有程序改动之小还体现在编程简易性和工具方面。编程简易性上，MIC常用的offload模式只需要加上少数几条编译指导语句，就可以使程序利用MIC进行运算，而此时的程序源代码，是可以与传统的CPU程序共用的，减少了维护成本。

2022-05-11 21:48:19 1.64MB mic与gpu对比

1

GPU高性能编程CUDA实战中文版.pdf

2022-05-11 11:03:34 28.95MB GPU，CUDA

1

深度学习，tensorflow-gpu2.1.1版本，TensorFlow-gpu版本c++动态库。

深度学习，tensorflow-gpu2.1.1版本，TensorFlow-gpu版本c++动态库。可以使用，包含include文件，dll和lib文件。

2022-05-10 09:09:15 49.79MB 深度学习 TensorFlow c++ c++动态库

Android专项测试之GPU测试探索

我们在安卓上进行性能测试时，如果想获取CPU以及内存等常用性能指标，linux系统自身就提供了现成的方法，谷歌官方甚至公司内部也都提供了大量功能强大的分析工具。而相比之下，想要获取GPU的相关指标则没那么容易，甚至我们对GPU应该使用什么指标衡量都几乎一无所知。这一方面是由于系统没有提供相关接口与命令，另一方面似乎业界目前对于GPU的关注度不足，相关积累与沉淀较少，鉴于此，个人感觉GPU测试这一块也可以作为终端专项后面需要关注及攻克的课题。通过这两天的调研，笔者将GPU的测试方法简单的分为两类：安卓官方提供的工具及方法；GPU厂商提供的工具及方法。下面将具体介绍这两类测试分析方法。google

2022-05-09 16:16:24 626KB Android专项测试之GPU测试探索

1

pyhpc-benchmarks:一套基准测试，可测试Python最流行的高性能库的顺序CPU和GPU性能

适用于Python的HPC基准这是一组基准测试，用于测试使用Python前端的各种计算后端的顺序CPU和GPU性能。具体来说，我们想测试哪种高性能后端最适合地球物理（基于有限差分）的模拟。内容常问问题为什么？科学的Python生态系统正在蓬勃发展，但是Python中的高性能计算还不是真正的事情。我们尝试来更改此，但是我们应该使用哪个后端进行计算？ Python前端到高性能后端的开发需要大量的时间和资源，但是这些通常是为深度学习量身定制的。我们想了解一下，通过（滥用）这些库进行地球物理建模，我们是否可以从这些进展中获利。为什么基准看起来如此怪异？这些或多或少是逐字记录副本（即物理模型的实际部分）。大多数地球系统和气候模型组件都基于有限差分方案来计算导数。这可以通过数组的索引移位（例如0.5 * (arr[1:] + arr[:-1]) ， arr在每个点的一

2022-05-09 16:03:04 236KB python tensorflow gpu parallel-computing

1

在FPGA，GPU和多核CPU上加速群智能算法的通用框架

2022-05-09 13:51:27 1.84MB 研究论文

1

thundergbm：ThunderGBM：GPU上的快速GBDT和随机森林

| | 什么是新的？ ThunderGBM获得了IEEE计算机协会出版委员会颁发的IEEE并行和分布式系统事务奖（2019年最佳论文奖）（在987篇论文中，有1篇是因为“ Zeyi Wen ^，Jiahuaai Shi *，Bingsheng He，Jian Chen，Kotagiri Ramamohanarao和李勤彬*，“为高效梯度提升决策树训练开发GPU”，IEEE并行和分布式系统交易，第30卷，第12期，2019年，第2706-2717页。”）。查看更多详细信息：，总览 ThunderGBM的任务是帮助用户轻松有效地应用GBDT和随机森林来解决问题。 ThunderGBM利用G

2022-05-08 14:50:49 11.94MB machine-learning random-forest gpu cuda

1

vs2015环境下的pcl库-gpu

vs2015环境下的pcl库，带了gpu模块，我费了好几天搞得，只需三个积分，

2022-05-08 11:27:23 46.12MB pcl gpu vs2015 x64

1

个人信息

热门下载

最新下载

其他资源