Python/Pytorch

[Error] CUDA-LAUNCH_BLOCKING=1 error

언킴 2022. 6. 25. 17:57
반응형

pytorch를 다루다 보면 아래와 같은 에러를 마주칠 때가 있다. 

 

이와 같은 CUDA 에러가 나는 원인은 다양하다. 가장 많이 발생하는 오류 중 하나는 loss 값을 계산할 때 값이 0~255 사이 값이 아니라 음수가 나오거나 하는 형태일 때 발생할 수 있다. 0~1사이로 정규화 하게되면 에러가 해결된다. 

 

이 뿐만 아니라 모델의 메모리가 부족한 경우에도 발생할 수 있으니 이때는 Batch size를 조절하거나 자연어처리인 경우 max length를 조절하는 등의 조치를 취해야 한다.