NPUbench测试结果–英伟达GeForce GTX 1080

图1:英伟达GeForce GTX 1080

英伟达GeForce GTX 1080是一款高性能的GPU,采用了16nm工艺、全新Pascal架构。它配有2560个CUDA核心,使用了256位8 GB GDDR5X内存,我们把NPUbench运行在这款设备上来看它的性能表现。

图2:英伟达GeForce GTX 1080 的前向时间组成

图2是在这款GPU上运行NPUbench的前向时间的构成情况,最终的测试结果与英伟达Jetson Tegra x1比较相似,ResNet-152进行一次前向过程所需要的时间要远高于NPUbench中的其他网络模型,它在卷积操作和BatchNorm操作上花费了大部分的时间,而仅次于ResNet-152的是Inception-BN网络模型,从表中我们也可以看到大部分的神经网络模型一次前向的时间几乎都花费在了卷积层以及全连接层之上。