본문 바로가기
728x90
반응형

독립성 검정2

적합도 검정, 독립성 검정 (Goodness of Fit Test, Independence Test) Goodness of Fit Test and Independence Test with Contingency Tables1. One-way Classifications (모형 적합도 검정)$k$개의 범주에 대하여 각 범주의 확률을 $p_i$ ($i=1,2,\dots, k$)라 하자.$k$개의 범주의 관측값은 각각 $x_1, x_2, \dots, x_k$이고 $x_1 + \dots + x_k=n$이다.이를 observed cell frequencies라 한다. null hypothesis는\[ H_0: p_i = p_i^* \quad (1 \le i \le k) \]이고 검정통계량은 다음 중 하나를 이용한다. (대부분 카이제곱 이용)\[ \chi^2 = \sum_{i=1}^{k} \frac{(x_i - e_.. 2024. 5. 26.
[Data Science] Chi-square test. 카이제곱검정 카이제곱검정목적동질성 검정과 독립성 검정 두 가지 검정이 가능하다. 동질성 검정: 데이터가 이항분포/정규분포와 동일한지 검정.독립성 검정: 두개 이상의 데이터가 서로 독립인지 검정. 이번 포스팅은 독립성 검정에 대하여 다룬다. 독립성 검정범주형 데이터(categorical attribute)에 대하여 두 데이터가 서로 독립인지 확인하는 검정이다.가설 검정$H_0$: 두 데이터는 독립이다. (실제 세계에서 서로 다른 두 변수는 독립으로 보는 것이 일반적이다.)$H_a$: 두 데이터는 독립이 아니다. (서로 상관성이 존재한다.) 검정 순서1. 두 범주형 데이터의 contigency table을 이용하여 Observed value($O_i$)와 Expected value($E_i$)를 구한다.2. 검정통계량 .. 2023. 4. 20.
728x90
반응형