Goodness of Fit Test and Independence Test with Contingency Tables
1. One-way Classifications (모형 적합도 검정)
이를 observed cell frequencies라 한다.
null hypothesis는
이고 검정통계량은 다음 중 하나를 이용한다. (대부분 카이제곱 이용)
이때
p-value는 다음과 같이 구한다.
size
※
※
※
Example: Testing Distributional Assumptions
주어진 데이터는 다음과 같다.

이때

카이제곱값을 계산하면
merged table에서 범주는 6개이므로
p-value가 상당히 크므로, null hypothesis를 기각하지 않는다.
즉, 주어진 데이터는
※ 더 일반적인 방법은 다음과 같다.
2. Two-way Classifications (독립성 검정)
2개의 카테고리에 대하여 독립성을 검정할 것이다. (Testing for Independence)
예를 들어, Type of Drug에는 A, B, C 3개의 drug level이 있고, Reaction에는 Hyperallergic, Allergic, Mildly allergic, No allergy 이렇게 4개의 level이 있다고 하자.

이때, 약물(drug)과 반응(reaction) 간의 독립성 검정의 귀무가설은 "세 약물 각각에 대해 다양한 종류의 알러지 반응이 발생할 가능성이 동일하다"로 해석할 수 있다.

Pearson chi-square statistic (
이때 expected frequency는
자유도 degree of freedom은
p-value는 다음과 같이 계산한다.
size

Drug-Allergy 예제에서
p-value가 크기 때문에 null hypothesis를 기각하지 않는다. (do not reject null hypothesis)
따라서 약물에 따른 알러지 반응은 독립적이다.
'스터디 > 확률과 통계' 카테고리의 다른 글
단순선형회귀 (Simple Linear Regression Model) (0) | 2024.06.02 |
---|---|
일원분류 분산분석 (One-Factor ANOVA) (1) | 2024.06.01 |
표본분산은 왜 n-1로 나눌까? (불편추정량, 자유도) (2) | 2024.05.21 |
모비율 검정 (Inferences on Population Proportion, Two Population Proportions) (0) | 2024.05.18 |
모평균 추정-모집단이 두개인 경우 (Comparing Two Population Means, Paired Samples, Independent Samples) (0) | 2024.05.16 |