728x90 반응형 Grubb's test1 [Data Science] Grubb's test를 이용한 Outlier detection 가정정규분포를 따르는 표본(sample)은 이상치(outlier)를 갖지 않을 것이다. 검정 방법통계량 $G$를 다음과 같이 정의하여 $G > G_{ref}$이면 이상치가 존재한다고 판단한다.$x_i$는 표본(sample), $\bar{x}$는 표본평균(sample mean), $s$는 표본표준편차(sample/empirical standard deviation)일 때 $G$는\[ G = \cfrac{\displaystyle\max_{1 \le i \le n}|x_i - \bar{x}|}{s} \] 유의수준 $\alpha$에 대하여 아래 부등식을 만족하면 "정규분포에서 추출된 표본은 이상치를 갖지 않는다"를 "기각"한다.\[ G > \cfrac{n-1}{\sqrt{n}}\sqrt{\cfrac{t^2_{1.. 2023. 4. 8. 이전 1 다음 728x90 반응형