2024年3月27日发(作者:善佳美)
CUDA中如何选择Block的尺寸
本文的硬件环境为GTX650,首先来简单介绍一下GTX650显卡与CUDA
编程相关的简单情况
[1]
:
l 是Kepler架构的最低等级产品;
l 由一组GPC (Graphics Processing Clusters)组成;
l 每个GPC内含两个SMX (Streaming Multiprocessors);
l 每个SMX包括192个stream processor和16个texture unit;
l 因此GTX650一共包括384个stream processor和32个texture unit。
下面是GTX650的图示:
图1 GTX650
顺便提一下,Kepler架构显卡的GPC都是相同的。
GTX660有三组GPC共5个SMX,因此拥有960个(192×5)stream processor
和80个(16×5)texture unit。
下面是GTX660的图示
[2]
:
图2 GTX660
GTX660Ti有四组GPC共7个SMX,因此拥有1344个(192×7)stream
processor和112个(16×7)texture unit。
下面是GTX660Ti的图示
[3]
:
S
U
O
C
E
M
N
O
I
T
C
E
L
L
图3 GTX660Ti
2024年3月27日发(作者:善佳美)
CUDA中如何选择Block的尺寸
本文的硬件环境为GTX650,首先来简单介绍一下GTX650显卡与CUDA
编程相关的简单情况
[1]
:
l 是Kepler架构的最低等级产品;
l 由一组GPC (Graphics Processing Clusters)组成;
l 每个GPC内含两个SMX (Streaming Multiprocessors);
l 每个SMX包括192个stream processor和16个texture unit;
l 因此GTX650一共包括384个stream processor和32个texture unit。
下面是GTX650的图示:
图1 GTX650
顺便提一下,Kepler架构显卡的GPC都是相同的。
GTX660有三组GPC共5个SMX,因此拥有960个(192×5)stream processor
和80个(16×5)texture unit。
下面是GTX660的图示
[2]
:
图2 GTX660
GTX660Ti有四组GPC共7个SMX,因此拥有1344个(192×7)stream
processor和112个(16×7)texture unit。
下面是GTX660Ti的图示
[3]
:
S
U
O
C
E
M
N
O
I
T
C
E
L
L
图3 GTX660Ti