获取资料

GPU并行计算与CUDA编程

GPU并行计算与CUDA编程

课程介绍

近年来,随着深度学习的高速发展,大数据技术的普及,接下来紧接的会普及发展的想必就是硬件层面的配合,而GPU无疑是最重要的趋势。过去几年,计算领域我们目睹了英伟达(NVIDIA)公司带来的变革。计算统一设备架构(Compute Unified Device Architecture, CUDA)编程语言的引入,第一次使这些非常强大的图形处理器为程序员日常所用,以应对日益复杂的计算工作。从嵌入式设备行业到家庭用户,再到超级计算机,所有的一切都因此而改变。

计算机软件界较大的变迁是从串行编程转向了并行编程。其中,CUDA起到了重要的作用。究其本质,图形处理单元(Graphics Processor Unit,GPU)是为高速图形处理而设计的,它具有天然的并行性。CUDA采用了一种简单的数据并行模型,再结合编程模型,从而无需操纵复杂的图形基元。

我们也可以轻而易举的发现各种各样的开源计算机库,例如OpenCV,Caffe,TensorFlow等等,都提供了对应于GPU的使用接口,使得GPU的使用越来越主流而高效。

本课程主要分为四部分,分别涵盖了硬件搭载知识、CUDA编程基础、CUDA性能优化与设计、实战项目经验。

授课对象:

对并行计算,GPU编程刚兴趣的同学,熟悉C/C++编程语言。

需要有带NVIDIA显卡的计算机,如果没有的同学可能需要额外购买AWS的GPU服务器,费用约是0.4美元/小时。

课程环境:

硬件环境:AWS G2 Instances(NVIDIA GRID K520) / CG1 Instances(NVIDIA Tesla M2050) /自备带NVIDIA GPU的电脑

操作系统:Linux 64bit (Ubuntu 14.04)

编程语言:C/C++

使用软件:CUDA7.5

收获预期:

具备GPU和CUDA编程能力,可以完成初步的GPU程序设计和优化设计,对于实际应用中CUDA的使用能有全面的考虑和实操能力。

课程目录

一. GPU与CUDA背景基础介绍

第1课 CUDA硬件环境,体系结构,软件环境介绍,包括平台、架构、开发工具和热点技术

第2课 并行编程介绍,CUDA核心概念,包括网格、线程块,不同类型内存的工作机制

二. CUDA编程基础

第3课 CUDA设备内存、常量内存、共享内存和纹理内存,CUDA流和事件

第4课 CUDA执行模式、线程调度、内核执行和CUDA存储器的使用

第5课 CUDA流处理器簇、多GPU编程、纹理操作

三. CUDA性能优化与设计

第6课 CPU/GPU协同编程,串行/并行程序中提高并行度的常用策略

第7课 流式负载以及使用GPU做应用程序性能优化常用策略

第8课 在集群中使用CUDA

四. 实战项目经验

第9课 应用CUDA做高维数据处理

第10课 CUDA+OpenGL做图形渲染

第11课 CPGPU实现视频流实时光流跟踪

第12课 深度学习框架中的GPU应用

评论0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址