본문 바로가기

연구/pytorch

[pytorch] model 학습 중 nan이 뜨는 원인2

반응형

예전 포스팅 중 model 학습 중 nan 이 뜨는 원인에 대해서 포스팅한 적이 있다. 이는 너무 작은 숫자로 나누는 경우에 발생하는 경우를 다루었었다. [https://powerofsummary.tistory.com/165]

하지만 이번에는 그게 아닌데도 nan이 뜨는 경우를 발견했다.

 

결론부터 말하면 lr가 너무 크면 nan이 발생할 수 있다고 한다. 나는 어떤 실험을 위해서 lr=0.1 로 설정했었는데, 이게 원인이 된 것 같다. lr: 0.1->0.01 로 줄였더니 nan이 안뜨더라.

 

반응형