|
|
ECC(error correcting code, 错误检查和纠正)能够提高数据的正确性,随之而来的是可用内存的减少和性能上的损失。对于Tesla系列伺服器该功能默认开启。
6 x- ]- [4 o' Y* D通过命令 nvidia-smi -i n
8 i4 @% T+ r# W: ^9 I. \7 i0 X可查看第n个个显卡的简要信息(详细信息可通过 nvidia-smi -q -i 0获取),其中有一项是volatile Uncorr. ECC, 可通过该选项查看当前配置。
7 ~3 D9 y2 y2 ^' l0 W- V通过 nvidia-smi -i n -e 0/1 可关闭(0)/开启(1)第n号GPU的ECC模式。3 | [( r7 @ r& |: l/ B6 ^
通过实践,关闭ECC程序的性能能得到13%~15%的提升。7 V/ d; M& l0 [; Q
AD:【加速器推荐】 搬瓦工官方代理服务Just My Socks,高速CN2 GIA线路流畅访问外网,被墙自动更换IP打赏赞(2) |
|