最近测试analyer_test的时候发现, 编译了GPU的Paddle比纯CPU的Paddle 速度下降约45%。
比如在 ef2da86 1.35305 => 1.97693
xwmevbvl1#
timeline 出来发现iteration直接的间隙特别大,GPU的时候更加明显
1条答案
按热度按时间xwmevbvl1#
timeline 出来发现iteration直接的间隙特别大,GPU的时候更加明显