본문 바로가기
스터디/확률과 통계

모평균 가설 검정 (Hypothesis Tests of a Population Mean, t-test, z-test)

by 궁금한 준이 2024. 5. 9.
728x90
반응형

Hypothesis testing, Null hypothesis, Alternative hypothesis, p-value

통계적으로 다양한 가설을 세울 수 있다. (평균, 분산, model fitness 등)

이 글에서는 모평균에 대한 가설과 그 검정방법을 소개한다.

Hypothesis

Null Hypothesis (H0, 귀무가설)

  • 초기에 설정하는 가설.
  • 효과가 없거나 차이가 없다는 주장을 담는다.

Alternative Hypothesis (HA, 대립가설)

  • 귀무가설과 대조(opposite)되는 가설.
  • 귀무가설이 틀렸다는 것을 보여주기 위해 사용된다.
  • 보통 대립가설이 "주장"이 되는 경우가 많다.

모평균(μ)과 관련된 가설은 다음과 같이 세팅된다.

two-sided set of hypothesis: H0: μ=μ0 vs. HA: μμ0

one-sided set of hypothesis: H0: μμ0 vs. HA: μ>μ0

one-sided set of hypothesis: H0: μμ0 vs. HA: μ<μ0

Interpretation of p-value

type I error (제 1종 오류): H0가 true인데, H0를 기각(reject)하는 오류.

type II error (제 2종 오류): H0가 false인데, H0를 채택(accept)하는 오류.

※ 좀 더 본질적인 통계학자의 시각은 not reject ≠ accept 이고 기각을 유보하는 것에 더 가깝다. 그러나 여기(학부 수준 textbook)에서는 not reject = accpet로 간주한다.

Error classification of hypothesis test

 

significane level (α, 유의수준): type I error의 확률의 상방(upper bound)을 특정할 값. 일반적으로 1%~10%의 범위를 선책하고 주 0.10, 0.05, 0.001 등을 사용한다. α=P(Type I error)

 과학적 가설의 관점에서 바라보면, false discovery를 더욱 경계할 것이다. 따라서 textbook에서는 type 1 error를 더 관심을 가지고 살펴보게 된다.

※ type I error와 type II error를 동시에 줄이는 방법은 존재하지 않는다. false discovery를 α로 고정시키고, type II error를 줄이는 방법 중심으로 서술한다.

 

p-value: H0가 true일 때, 내가 가진 데이터가 더 안좋을 확률. (probability of obtaining a given data set or worse when the null hypothesis is true)

  • p-value가 크면, 내 데이터셋이 H0에서 발생할 법하다(likely to happen)는 뜻이다.
  • p-value가 크다고 해서 H0가 true라는 뜻은 아니다. (H0가 true일때~ 이므로)
  • p-value가 작으면, H0가 less plausible하다는 뜻이다. 
  • p-value가 작다는 건, H0가 not plausible하다는 증거(evidence)는 있지만, 압도적이지는 않다.(not overwhelming)
  • p-value가 크다/작다의 비교 대상은 α이다. (아래 자세히 설명)

Calculation of p-values

two-sided t-test

testing H0:μ=μ0 vs. HA:μμ

이때 p-value=2×P(T|t|)

이때 T=X¯μ0S/n, t=x¯μ0s/n이고 Ttn1이다. 

 

one-sided t-test

testing H0:μμ0 vs. HA:μ>μ

p-value=2×P(T>t) (HA의 방향을 따라간다.)

이때 T=X¯μ0S/n, t=x¯μ0s/n이고 Ttn1이다. 

 

testing H0:μμ0 vs. HA:μ<μ

p-value=2×P(T<t) (HA의 방향을 따라간다.)

이때 T=X¯μ0S/n, t=x¯μ0s/n이고 Ttn1이다. 

Decision rules for a size α hypothesis test

 

※ 가설검정의 다른 방법은 네이만-피어슨 가설 검정이다. 수리통계학과 같은 고급 과목에서 소개하며 보다 더 수학적으로 검정력을 계산하는 접근법이다. (확률적 기각?)

그러나 후대에 오면서 피셔의 검정법과 네이만-피어슨의 검정법이 섞인 방법이 학부 통계에서 배우는 검정법으로 보인다. (p-value와 α가 동시에 등장)

 

Significance Levels (유의수준)

사실 귀무가설의 기각/채택은 α에 따라 달라진다. 같은 p-value여도 실험 전에 어떤 α를 골랐느냐에 따라 귀무가설의 기각/채택의 선택이 갈리게 된다.

 

α는 Type I error의 확률과 의미가 같다. Type I error를 줄이는 것은, 작은 α를 의미하고, H0을 지키는(protection)이 된다.

 

Decision Process

p-value < α이면, rejection of H0 (귀무가설을 기각)

p-value > α이면, accpetance(or, not rejection) of H0 (귀무가설을 채택)

(p-value 계산 방법은 위에 설명)

 

size α test for two-sided hypothesis

testing H0:μ=μ0 vs. HA:μμ0

에서 test statistics |t|의 rejection region은 |t|>tα/2,n1이고, acceptance region은 |t|tα/2,n1 이다.

 

confidence interval과 hypothesis testing간의 관계에서 연결고리를 찾을 수 있다. 신뢰도가 (1α)인 two-sided confidence interval에서, μ0가 이미 신뢰구간안에 포함되어 있다면, p-value > α이므로 H0을 기각하지 않는다.

Relationship between hypothesis testing and confidence intervals

 

마찬가지로, one-sided testing에서도 동일한 결과를 얻을 수 있다.

testing H0:μμ0 vs. HA:μ>μ0

  • test statistics: t
  • Rejection region: t>tα,n1 (HA와 같은 부등호 방향)
  • Acceptance region: ttα,n1
  • Confidence interval: μ(x¯tα,n1sn, )
  • μ0가 위 신뢰구간에 존재하면, p-value > α이므로, H0 accept

testing H0:μμ0 vs. HA:μ<μ0

  • test statistics: t
  • Rejection region: t<tα,n1 (HA와 같은 부등호 방향)
  • Acceptance region: ttα,n1
  • Confidence interval: μ(, x¯+tα,n1sn)
  • μ0가 위 신뢰구간에 존재하면, p-value > α이므로, H0 accept

Power of hypothesis test (검정력)

power=1Pr(Type II error)

power는 H0가 false일 때 H0가 기각될 확률이다.

α=Pr(Type I error) 라는 것에 비교하여, β=Pr(Type II error)라고도 표기한다. 이때는 power = 1β로 표기한다.

 

Hypothesis testing과 CI를 결정짓는 3가지 요소들

z-Tests

n개의 observed data가 있고, 표본평균이 x¯이고 분산이 σ2으로 알려진(knwon) 샘플에서 가설 검정을 해보자. 

z-statistic: Z=Xμ0σ/n

(t-test,s,tα,n1)(z-test,σ,zα)

 

testing H0:μ=μ0 vs. HA:μμ0

  • test statistics: z
  • p-value = 2×Φ(|z|)
  • Rejection region: |z|>zα/2
  • Acceptance region: |z|zα/2
  • Confidence interval: μ(x¯zα/2σn, x¯+zα/2σn)
  • μ0가 위 신뢰구간에 존재하면, p-value > α이므로, H0 accept

testing H0:μμ0 vs. HA:μ>μ

  • p-value = 1Φ(z)
  • Rejection region: z>zα/2
  • Acceptance region: zzα/2
  • Confidence interval: μ(x¯zα/2σn, )
  • μ0가 위 신뢰구간에 존재하면, p-value > α이므로, H0 accept

testing H0:μμ0 vs. HA:μ<μ0

  • p-value = Φ(z)
  • Rejection region: z>zα/2
  • Acceptance region: zzα/2
  • Confidence interval: μ(, x¯+zα/2σn)
  • μ0가 위 신뢰구간에 존재하면, p-value > α이므로, H0 accept
728x90
반응형