Manifold Mixup: Better Representations by Interpolating Hidden States

(Curtis Kim) #1

요약

  • 모든 데이터 포인트에서 over-confident 한 부분이 문제
  • 트레이닝 시점에 두 example로부터 random layer를 선택해 섞고 label도 섞은 비율만큼으로 조절함
  • CIFAR10/100 에서 성능이 많이 오름. over-confident 문제도 해결함.