본문 바로가기
728x90
반응형

Independence3

적합도 검정, 독립성 검정 (Goodness of Fit Test, Independence Test) Goodness of Fit Test and Independence Test with Contingency Tables1. One-way Classifications (모형 적합도 검정)$k$개의 범주에 대하여 각 범주의 확률을 $p_i$ ($i=1,2,\dots, k$)라 하자.$k$개의 범주의 관측값은 각각 $x_1, x_2, \dots, x_k$이고 $x_1 + \dots + x_k=n$이다.이를 observed cell frequencies라 한다. null hypothesis는\[ H_0: p_i = p_i^* \quad (1 \le i \le k) \]이고 검정통계량은 다음 중 하나를 이용한다. (대부분 카이제곱 이용)\[ \chi^2 = \sum_{i=1}^{k} \frac{(x_i - e_.. 2024. 5. 26.
[Data Science] Chi-square test. 카이제곱검정 카이제곱검정목적동질성 검정과 독립성 검정 두 가지 검정이 가능하다. 동질성 검정: 데이터가 이항분포/정규분포와 동일한지 검정.독립성 검정: 두개 이상의 데이터가 서로 독립인지 검정. 이번 포스팅은 독립성 검정에 대하여 다룬다. 독립성 검정범주형 데이터(categorical attribute)에 대하여 두 데이터가 서로 독립인지 확인하는 검정이다.가설 검정$H_0$: 두 데이터는 독립이다. (실제 세계에서 서로 다른 두 변수는 독립으로 보는 것이 일반적이다.)$H_a$: 두 데이터는 독립이 아니다. (서로 상관성이 존재한다.) 검정 순서1. 두 범주형 데이터의 contigency table을 이용하여 Observed value($O_i$)와 Expected value($E_i$)를 구한다.2. 검정통계량 .. 2023. 4. 20.
조건부확률과 독립 (Conditioning, Independence) Section 8. Conditioning and Independence. 조건부확률과 독립Conditional distribution of $Y$ given $X=x$\[ P(Y \in B | X=x) = \cfrac{P(Y \in B, X=x)}{P(X=x)} \]Conditional distribution - Discrete\[ p_{Y|X}(y|x) = \cfrac{p_{X,Y}(x,y)}{p_X(x)} \]Conditional distribution - Continuousconditional density of $Y$, given $X=x$\[ f_{Y|X}(y|x) = \cfrac{f_{X,Y}(x,y)}{f_X(x)} \]따라서 확률 $P(a \le Y \le b|X=x)$를 구하면\[ P(.. 2023. 3. 23.
728x90
반응형