One-Factor Analysis of Variance (ANOVA)
Analysis of Variance (ANOVA)
모집단이 2개의 경우 모평균(또는 모비율)을 비교하는 방법을 다루었다.
이제 모집단이 3개 이상인 경우에 대해 생각해보자.
기본적인 아이디어는 통계적 분석(statistical analysis)이 같은지 확인하는 것이다.
여러개의 모집단에서 추출된 독립 표본의 집합을 completely randomized design(완전임의배치법)이라 한다.
그리고 분산분석(analysis of variance, ANOVA)라는 통계적 방법론을 이용한다.
모집단이 2개인 경우, pair인지 independent인지 구분하여 검정하였다.
모집단이 3개 이상인 경우에도 비슷한 방식으로 구분한다.
첫번째는 blocking이고 두번째는 randomized block design(랜덤화 블록 설계)이라 부른다.
blocking은 pairing observation의 개념이고, randomized block design은 여러가지 모평균을 blocking과 엮은
randomized block design은 two-factor ANOVA에서 사용되는 가정이다.
※ 이름은 "분산분석"이지만 모집단의 모평균을 비교하는 방법이다. 분산 분석을 통한 모평균 추정법이라고 할 수 있다.
※ 분산 자체에 대한 통계적 검정은 "등분산 검정(분산의 동질성)"이 있다.
One-Factor Layouts
실험자(experimenter)가

Modeling Assumption
또한
가설은 다음과 같다.
Partitioning the Total Sum of Squares
Treatment of Sum of Squares (SSTr)
null hypothesis에서
따라서 전제 데이터(all of the data observations)는 다음과 같다.
그러면 산포도(variability)는 다음과 같이 정의할 수 있고 이를 SSTr이라 한다.
※ textbook에 따라 SSB로 표기하기도 한다. (between)
※
※ SSTr은
SSTr을 변형하여 다음과 같이 계산할 수 있다.
Error Sum of Squares (SSE)
factor-level 내에서의 error도 측정해야한다. 이때의 variability는 sum of squares of error (SSE)라 한다.
※ textbook에 따라 SSW로 표기하기도 한다. (within)
※ SSE은
Total Sum of Squares (SST)
※ SST는 전체 표본의 산포도이다. (a measure of the total variablity in the dataset)
※ SST = SSTr + SSE 이다.
※ 일반적으로 SST와 SSTr을 계산하여 SSE를 얻는 편이 편하다. (
Analysis of Variance Table
SSTr은
따라서 mean squares for treatment (MSTr)와 mean square error (MSE)는 다음과 같이 정의한다.
(i)
따라서
그리고 카이제곱분포의 합의 자유도는 각 자유도의 합이므로
따라서,
카이제곱분포의 기댓값에 따라
(ii)
따라서
만약
이렇게 계산한 p-value가 작으면 기각(reject)한다. 즉 어떤 factor-level끼리의 평균이 같지 않다는 것이다. (e.g.

이 모든 과정을 F-test라 하고, 표로 정리하면 다음과 같다.

Pairwise Comparisons of the Factor Level Means
위의 과정대로 F-test를 통해 p-value를 계산하고, 그 값이 유의수준
그러면 pairwise로 비교해서 어떤 pair가 얼마나 다른지 확인해야 한다.
※
※ 다양한 방법이 있지만, 여기서는 Tukey-Kramer method만을 다룬다.
※ See also: Multiple Comparison, Scheffé's mehod, Bonferroni correction, False Discover Rate (FDR)
이때
이렇게 구한 C.I.에
Sample Size Determination
위에서 구한 신뢰구간을 바탕으로, 표본 수를 구할 수 있다.
만약 모든 factor의 샘플 수를 동일하게 할 것이라면,
만약 연구자가 특정
'스터디 > 확률과 통계' 카테고리의 다른 글
[비모수 통계] 비모수 통계학은 무엇인가? (0) | 2025.04.06 |
---|---|
단순선형회귀 (Simple Linear Regression Model) (0) | 2024.06.02 |
적합도 검정, 독립성 검정 (Goodness of Fit Test, Independence Test) (0) | 2024.05.26 |
표본분산은 왜 n-1로 나눌까? (불편추정량, 자유도) (2) | 2024.05.21 |
모비율 검정 (Inferences on Population Proportion, Two Population Proportions) (0) | 2024.05.18 |