
카이제곱검정
목적
동질성 검정과 독립성 검정 두 가지 검정이 가능하다.
동질성 검정: 데이터가 이항분포/정규분포와 동일한지 검정.
독립성 검정: 두개 이상의 데이터가 서로 독립인지 검정.
이번 포스팅은 독립성 검정에 대하여 다룬다.
독립성 검정
범주형 데이터(categorical attribute)에 대하여 두 데이터가 서로 독립인지 확인하는 검정이다.
가설 검정
검정 순서
1. 두 범주형 데이터의 contigency table을 이용하여 Observed value(
2. 검정통계량 카이제곱을 구한다.
3. 통계량의 자유도를 구한다.
4. 카이제곱분포표에서 3에서 구한 자유도와 유의수준
5.
예제 1
어떤 약의 효능을 검정하기 위해서 위약(placebo)을 사용하려고 한다.
전체 37명의 환자에게 신약과 위약에 대한 증상 향상을 표로 나타내면 아래와 같다.
이때 치료와 증상의 상관관계가 있는가?

예제 2
어떤 전자부품 가게에서는 연령에 따른 전자기기의 판매량의 상관관계를 조사하려고 한다.
이때 연령은 65세 미만 집단과 65세 이상의 집단만 존재하고, 전자기기는 마우스와 터치스크린 2가지만 있다고 하자.
연령에 따른 전자기기의 선호도가 있는가?

예제 1 풀이
우선 주어진 표를 이용하여 Expected value 표를 만들어보자.
Expected value는 (Row)
예를 들어, 신약의 향상분은
이를 바탕으로 Expected value를 모두 계산하면 아래 표와 같다.

다음으로, 검정통계량이

이제 critical value를 찾아보자. 행과 열이 각각 2, 2이므로 자유도는
카이제곱분포표에서 자유도가
예제 2 풀이
주어진 표를 이용하여 기댓값을 계산한 표를 구해보자.

다음으로, 검정통계량이

이제 critical value를 찾아보자. 행과 열이 각각 2, 2이므로 자유도는
카이제곱분포표에서 자유도가
'스터디 > 데이터사이언스' 카테고리의 다른 글
[Data Science] Decision Tree in R (0) | 2023.04.28 |
---|---|
[Data Science] Missing Values (0) | 2023.04.21 |
[Data Science] Association Rule Mining - Excercises (1) | 2023.04.17 |
[Data Science] Decision Tree - GINI index와 CART 알고리즘 (0) | 2023.04.16 |
[Data Science] The classification and decision tree (0) | 2023.04.15 |