728x90
반응형
Section 8. Conditioning and Independence. 조건부확률과 독립
Conditional distribution of $Y$ given $X=x$
\[ P(Y \in B | X=x) = \cfrac{P(Y \in B, X=x)}{P(X=x)} \]
Conditional distribution - Discrete
\[ p_{Y|X}(y|x) = \cfrac{p_{X,Y}(x,y)}{p_X(x)} \]
Conditional distribution - Continuous
conditional density of $Y$, given $X=x$
\[ f_{Y|X}(y|x) = \cfrac{f_{X,Y}(x,y)}{f_X(x)} \]
따라서 확률 $P(a \le Y \le b|X=x)$를 구하면
\[ P(a \le Y \le b|X=x) = \int_a^b f_{Y|X}(y|x) dy \]
위의 정의와 식에서 보듯이, 조건부확률을 구하기 위해서는 주변확률(marginal)을 구해야한다.
Example
$f_{X,Y}(x,y) = 4x^2y + 2y^5 (0 \le x \le 1, \ 0 \le y \le 1)$일 때, $X, Y$가 독립인지 알아보자.
$f_X(x) = 2x^2 + (1/3)$이고 $f_Y(y) = \frac{4}{3}y + 2y^5$를 구한 후 두 함수를 곱한다.
$f_{X, Y}(x, y) \neq f_X(x) f_Y(y)$이므로 두 확률변수 $X, Y$는 독립이 아니다.
Independence of Random Variables
Independent random variables
$X, Y$가 각각 실수($\mathbb{R}$)의 부분집합 $B_1, B_2$의 원소일 때, 다음을 만족하면 독립이다.
\[ P(X \in B_1, Y \in B_2) = P(X \in B_1) P(Y \in B_2) \]
위 정의를 아래의 표현으로 바꿀 수 있다.
\[ P(a \le X \le b, c \le Y \le d) = P(a le X \le b)P(c \le Y \le d) \ (a \le b \text{ and } c \le d) \]
For discrete random variables,
\[ p_{X,Y}(x,y) = p_X(x) p_Y(y) \text{ or } p_{Y|X}(y|x) = p_Y(y) \]
$n$개의 확률변수로 일반화하면
\[ p_{X_1, \dots , X_n}(x_1, \dots, x_n) = p_{X_1}(x_1) \cdots p_{X_2}(x_n) \]
For (absolutely) continuous random variables,
\[ f_{X,Y}(x,y) = f_X(x) f_Y(y) \text{ or } f_{Y|X}(y|x) = f_Y(y) \]
$n$개의 확률변수로 일반화하면
\[ f_{X_1, \dots , X_n}(x_1, \dots, x_n) = f_{X_1}(x_1) \cdots f_{X_2}(x_n) \]
Note: $X_1, \dots , X_n$은 각자 다른 분포의 확률변수여도 된다.
위 3~4가지 정의만으로도 $X, Y$의 독립을 판단하기는 쉽지 않다.
아래 정리를 이용하면 보다 쉽게 독립을 판단할 수 있다.
두 확률변수 $X, Y$가 독립이라면, 두 확률변수 $f(X), g(Y)$ 역시 독립이다.
Note: $X, Y$가 독립이면 $X^3$과 $3Y-2$ 역시 독립이다.
$n$개의 데이터가 i.i.d.(independent and identically distributed) 확률변수 $X_1, \dots , X_n$이라 할 때, joint density(or joint pmf)는 다음과 같다.
\[ f_{X_1, \dots, X_n}(x_1, \dots, x_n) = f_X(x_1) \cdots f_X(x_n) \]
Note: i.i.d 의 경우 같은 분포에서 얻은 확률변수이기 때문에 아래첨자는 똑같은 $X$로 표기할 수 있다.
Example
$X_1, \dots, X_n \sim \text{Exp}(\lambda)$라 할 때 joint pdf는
$f_{X_1, \dots, X_n}(x_1, \dots, x_n) = \lambda e^{-\lambda x_1} \cdots \lambda e^{-\lambda x_n} = \lambda^n e^{-\lambda \sum_{i=1}^{n}x_i}$
728x90
반응형
'스터디 > 확률과 통계' 카테고리의 다른 글
이산확률변수의 기댓값, Expectation of Discrete Case (Bernoulli, Binomial, Geometric, Poisson) (0) | 2023.03.29 |
---|---|
다항분포, Multinomial Distribution (0) | 2023.03.23 |
결합확률분포, Joint Distribution (0) | 2023.03.23 |
확률변수의 변환, Change of Variable (0) | 2023.03.21 |
누적분포함수, Cumulative Distribution Function (CDF) (0) | 2023.03.21 |