본문 바로가기
스터디/확률과 통계

결합확률분포, Joint Distribution

by 궁금한 준이 2023. 3. 23.
728x90
반응형

Section 7. Joint Distributions

Joint Cumulative Distribution Functions, 결합 누적 분포 함수

확률면수 $X$, $Y$에 대하여 둘의 분포를 정확히 알 고 있다고 하자. 

그러나 이 둘의 관계(relationship)에 대해서는 아는바가 없다.

 

Joint Cumulative Distribution Functions, 결합 누적 분포 함수, joint cdfs

두 확률변수 $X, Y$에 대하여 결합누적분포함수 $F_{X, Y}: \mathbb{R} \to [0, 1]$을 다음과 같이 정의한다.

\[ F_{X, Y}(x, y) = P(X \le x, Y \le y) \]
Note: comma($,$)는 "and"를 의미한다. 즉 $P(X \le x \ and \  Y \le y)$이다.

$P(a < X \le b, c < Y \le d) = F_{X, Y}(b, d) - F_{X, Y}(a, d) - F_{X, Y}(b, c) + F_{X, Y}(a, c)$

 

Marginal Distributions, 주변확률분포

이제 우리는 joint cdf $F_{X, Y}$로 $X$와 $Y$의 관계를 알 수 있다. 그러나 $F_{X,Y}$는 $X$나 $Y$의 정보를 주지 못한다. 이제 $F_{X, Y}$로부터 $F_X, F_Y$를 구해보자.

두 확률변수 $X, Y$의 joint cdf를 $F_{X, Y}$라 하자. 이때 $X$와 $Y$의 cdf는 다음과 같이 구한다.

\[ F_X(X) = \lim_{y \to \infty} F_{X, Y}(x, y), \forall_x \in \mathbb{R} \]
\[ F_Y(y) = \lim_{x \to \infty} F_{X, Y}(x, y), \forall_y \in \mathbb{R} \] 
Note: $F_{X,Y}$로 얻은 $F_X$를 marginal cumulative distribution function이라 부르고, 이때의 $X$의 분포를 marginal distribution이라 부른다.

Proof

$F_X(x) = P(X \le x) = P(X \le x, \ Y \le \infty) = \displaystyle\lim_{y \to \infty}P(X \le x, \ Y \le y) = \lim_{y \to \infty}F_{X,Y}(x,y)$

 

Joint Probability Function, 결합 확률 (질량) 함수

두 (이산)확률변수 $X, Y$에 대하여 $\mathbb{R}^2 \to \mathbb{R}$로 사상하는 결합확률(질량)함수(joint probability function) $p_{X, Y}$를 다음과 같이 정의한다.
\[ p_{X,Y}(x,y) = P(X=x, Y=y) \]

 

joint probability function을 안다면, marginal probability function 역시 쉽게 구할 수 있다.

두 (이산)확률변수 $X, Y$의 joint probability function을 $p_{X, Y}$라 할 때 $X, Y$의 확률함수 $p_X, p_Y$를 다음과 같이 구한다.
\[ p_X(x) = \sum_{y }p_{X,Y}(x, y) \]
\[ p_Y(y) = \sum_{x} p_{X,Y}(x, y) \]

Proof

$P_X(x) = P(X = x) = \displaystyle\sum_{y}P(X=x, Y=y) = \sum_{y}p_{X, Y}(x,y)$

 

Example 2.7.5

joint probability function이 다음과 같이 정의되어있다.

\[ p_{X,Y}(x,y) = \begin{cases} 1/7 \qquad x=5,y=0 \\ 1/7 \qquad x=5,y=3 \\ 1/7 \qquad x=5,y=4 \\ 3/7 \qquad x=8,y=0 \\ 1/7 \qquad x=8,y=4 \\ 0 \quad \qquad \text{otherwise.} \end{cases} \]

확률분포표를 만들면 쉽게 확률을 구할 수 있다.

Example 2.7.5의 확률분포표

따라서 $P_X(5)=1/7 + 1/7 + 1/7 = 2/7$, $p_X(4)=3/7 + 1/7 = 4/7$, $p_Y(4) = 1/7+1/7=2/7$이다.

 

Joint Density Functions, 결합(밀도)함수

Joint Density Function

$f:\mathbb{R}^2 \to \mathbb{R}$가 $f(x, y) \ge 0$이고 $\int_{\infty}^{\infty}\int_{\infty}^{\infty}f(x, y) dxdy=1$을 만족하면 결합(밀도)함수라고 부른다. 

joint density function을 이용하여 확률을 계산할 때는 아래와 같이 계산한다.
\[ P(a \le X \le b, \ c \le Y \le d) = \int_c^d \int_a^bf(x, y) dxdy \]
두 (연속)확률변수 $X, Y$의 joint density function을 $f_{X, Y}$라 하자. 이때 $X$, $Y$의 (marginal) density function은 아래와 같이 구한다.

\[ f_X(x) = \int_{-\infty}^{\infty}f_{X, Y}(x, y) dy \]
\[ f_Y(y) = \int_{-\infty}^{\infty}f_{X, Y}(x, y) dx \]

Example 2.7.8

joint density 가 아래와 같을 때, 물음에 답하여라.

\[ f_{X, Y}(x, y) = \begin{cases} 120x^3y \qquad x \ge 0. y \ge 0. x+y \le 1 \\ 0 \ \qquad \qquad \text{otherwises.} \end{cases} \]

Example 2.7.8의 정의역

(1) density function이 맞는가?

$\displaystyle\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f_{X,Y}(x,y)dxdy = \int_{0}^{1}\int_{0}^{1-x}120x^3y \ dydx = \int_{0}^{1}120x^3\cfrac{(1-x)^2}{2}dx=1$

따라서 $f_{X,Y}$는 결합밀도함수이다.

 

(2) $f_X(x)$를 구하여라.

$\displaystyle f_X(x)=\int_0^{1-x}120x^3y \ dy = 120x^3\cfrac{(1-x)^2}{2} = 10(x^3-2x^4+x^5) \ (0 \le x \le 1)$

 

※ 범위를 반드시 명시해야 한다.

728x90
반응형