NPUbench测试结果–英伟达Jetson Tegra x1

图1:英伟达Jetson Tegra x1

英伟达Jetson Tegra x1是一款嵌入式的开发平台,它配有256颗CUDA核心,使用TSMC 20nm SoC制造工艺,使用64位的LPDDR4内存,能够提供每秒超过一万亿次的浮点运算性能,我们把NPUbench全部部署到此设备上来测试其性能。

图2: 英伟达Jetson Tegra x1的性能及功耗图

图2是NPUbench在这台设备上的前向时间构成图以及平均功耗,从图中可以看到ResNet-152要比其他网络消耗更多的时间,而消耗更多功耗的则是Sequence to Sequence这一网络结构。