高性能计算福音NVIDIACUDA6宣布支持统一寻址

分享到:
354
下一篇 >

作为**计算领域冉冉升起的新星,NVIDIA凭借其GPGPU解决方案成功占领了很多高性能计算和大规模联合渲染市场。能够取得这样的成绩一方面源于NVIDIA GPGPU产品超强的并行计算能力,而另一方面则来自于CUDA这种高效率的类C开发语言。而现在,NVIDIA正式发布了CUDA 6,该版本加入了对统一寻址功能的支持,另GPGPU可以更方便的调用系统内存,从而大幅提升计算效能。

支持统一寻址可使GPGPU直接访问CPU内存、GPU显存,无需在彼此之间手动拷贝数据,可在大量编程语言中更简单地添加GPU加速支持,提高编程和执行效率,降低程序复杂度。

其实CUDA 4就开始支持统一虚拟寻址,x86 CPU、GPU内存池可在同一空间内进行寻址,但那仅仅是简单的内存管理,摆脱不了手动数据转移。

CUDA 6则在现有的内存池结构上增加了一个统一内存系统,程序员可以直接访问任何内存/显存资源,或者在合法的内存空间内寻址,而不用管涉及到的到底是内存还是显存。

不过注意,CUDA 6并不是完全不需要数据拷贝,只不过将这个工作从程序员那里接过来自动执行而已,它仍然受制于PCI-E的带宽和延迟,因此和AMD hUMA异构统一寻址架构是不一样的。

NVIDIA的统一内存寻址

简化的内存管理代码

另外值得一提的是,NVIDIA此前已经宣布下代GPU Maxwell将会支持统一虚拟内存,但它要到明年才会发布。NVIDIA表示,他们找到了完全通过软件执行统一内存的方法,所以就提前这么做了,Maxwell则会有某种硬件层面的统一内存技术(或许性能更高),但具体细节还有待公布。

在消费级领域,由于索尼PS4游戏机的发布,统一寻址技术开始进入人们的视线(PS4的GPU和CPU使用统一的GDDR5作为系统内存和显存使用,不再彼此分开),这一应用的特点便是大幅度提高了程序的执行效率,减少各种拷贝操作和相应的等待时间。虽然AMD的GPGPU产品也在高性能计算领域有所建树,但由于缺乏一种好用、易用的编程环境,AMD在高性能计算市场的表现始终不敌竞争对手NVIDIA。而现在,AMD和NVIDIA都有了自己的统一寻址技术,未来超算的性能和效率有望得到进一步提升。

你可能感兴趣: 服务器 业界新闻 图片
无觅相关文章插件,快速提升流量