博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《OpenACC并行程序设计:性能优化实践指南》一 3.11 小结
阅读量:6681 次
发布时间:2019-06-25

本文共 342 字,大约阅读时间需要 1 分钟。

3.11 小结

虽然PIConGPU是一个具体示例,但确定性能瓶颈是真实的,并且所呈现的解决方案也可以应用于其他应用。使用CUDA(PIConGPU实现)或OpenACC对加速器编程,两者没有什么区别。涉及基础MPI活动的改进可用于这两种范例。

本章学习内容:
性能分析是每个程序(并行程序,特别是混合程序)开发的一个组成部分,尽可能高效地利用可用资源。
基于采样的分析运行时开销非常低,可以提供程序执行中潜在的热点。
基于事件的追踪提供程序执行期间所有并行活动的信息。为了不使I/O子系统过载,应该仔细选择日志级别。
通过追踪文件的交互式导航和应用程序各种阶段间歇性分析的可能性,使应用开发人员可以更好地了解应用程序在任何时间点正在做什么。
MPI和加速器的异步活动是高性能的关键。

转载地址:http://yusao.baihongyu.com/

你可能感兴趣的文章
Myeclipse中导入jar包的方法
查看>>
Hadoop学习笔记—2.不怕故障的海量存储:HDFS基础入门
查看>>
Maven - 项目结构
查看>>
c#二维码资料
查看>>
topcoder srm 715 div1 -23
查看>>
梯度下降(Gradient Descent)小结
查看>>
一起谈.NET技术,使用User Control做HTML生成
查看>>
谷歌启动搜索引擎新功能 网页Flash内容即时预览
查看>>
专访梭子鱼:以“立体交付”保障Web应用安全
查看>>
微软SQL Server 2012新特性Silverlight报表客户端 - Power View
查看>>
记一次网站收录数和排名的实现
查看>>
pthread_cond_wait()用法分析
查看>>
poj-3368 Frequent values ***
查看>>
Install IIS 7.5 PHP & FastCGI for PHP on Windows 7
查看>>
C#连接Excel示例代码和驱动
查看>>
彻底弄明白之java多线程中的volatile
查看>>
RPi 2B IPC webcam server
查看>>
(转)一文学会用 Tensorflow 搭建神经网络
查看>>
30幅非常漂亮的微距摄影作品欣赏
查看>>
6、关于ctemplate的一个例子
查看>>