본문 바로가기
스터디/인공지능, 딥러닝, 머신러닝

[CS224w] General Tips for Debugging GNN

by 궁금한 준이 2023. 6. 18.
728x90
반응형

꼭 GNN에 해당하는 내용은 아니겠지만, cs224w에서 별도의 강의 슬라이드를 만들었으니 간단히 정리한다.

 

General Tips

  • 데이터 전처리는 매우 중요하다. 
  • note attribute는 매우 많다. 따라서 정규화(normalization)을 해야한다. 
  • 확률이라면 $(0, 1)$로, 필요(데이터)에 따라 넓은 범위도 가능하다. 
  • Optimizer: Adam이면 상대적으로 robust하다.
  • Activation function: ReLU도 충분하지만 LeakyReLU, PReLU도 좋다. 그러나 output layer에는 activation function을 적용하면 안된다. 그리고 모든 layer에 bias를 추가한다.
  • Embedding dimension: 32, 64, 128 차원에서 시작한다. 학습결과에 따라 임베딩 차원을 바꾸어 간다.

 

Debugging Deep Networks

training 단계에서 loss/accuracy 등이 수렴하지 않을 때는 다음을 살펴본다.

  • pipeline 살펴보기. 특히 PyTorch에서 zero_grad를 제대로 사용했는지 확인
  • hyperparameter 바꿔보기 (e.g. learning rate)
  • weight parameter 초기화도 중요하다.
  • loss function을 잘 살펴본다.

 

Resources on GNN

다음 논문들도 좋은 tutorial이 될 수 있다.

728x90
반응형