Section 7. Joint Distributions
Joint Cumulative Distribution Functions, 결합 누적 분포 함수
확률면수 $X$, $Y$에 대하여 둘의 분포를 정확히 알 고 있다고 하자.
그러나 이 둘의 관계(relationship)에 대해서는 아는바가 없다.
Joint Cumulative Distribution Functions, 결합 누적 분포 함수, joint cdfs
두 확률변수 $X, Y$에 대하여 결합누적분포함수 $F_{X, Y}: \mathbb{R} \to [0, 1]$을 다음과 같이 정의한다.
\[ F_{X, Y}(x, y) = P(X \le x, Y \le y) \]
Note: comma($,$)는 "and"를 의미한다. 즉 $P(X \le x \ and \ Y \le y)$이다.
$P(a < X \le b, c < Y \le d) = F_{X, Y}(b, d) - F_{X, Y}(a, d) - F_{X, Y}(b, c) + F_{X, Y}(a, c)$
Marginal Distributions, 주변확률분포
이제 우리는 joint cdf $F_{X, Y}$로 $X$와 $Y$의 관계를 알 수 있다. 그러나 $F_{X,Y}$는 $X$나 $Y$의 정보를 주지 못한다. 이제 $F_{X, Y}$로부터 $F_X, F_Y$를 구해보자.
두 확률변수 $X, Y$의 joint cdf를 $F_{X, Y}$라 하자. 이때 $X$와 $Y$의 cdf는 다음과 같이 구한다.
\[ F_X(X) = \lim_{y \to \infty} F_{X, Y}(x, y), \forall_x \in \mathbb{R} \]
\[ F_Y(y) = \lim_{x \to \infty} F_{X, Y}(x, y), \forall_y \in \mathbb{R} \]
Note: $F_{X,Y}$로 얻은 $F_X$를 marginal cumulative distribution function이라 부르고, 이때의 $X$의 분포를 marginal distribution이라 부른다.
Proof
$F_X(x) = P(X \le x) = P(X \le x, \ Y \le \infty) = \displaystyle\lim_{y \to \infty}P(X \le x, \ Y \le y) = \lim_{y \to \infty}F_{X,Y}(x,y)$
Joint Probability Function, 결합 확률 (질량) 함수
두 (이산)확률변수 $X, Y$에 대하여 $\mathbb{R}^2 \to \mathbb{R}$로 사상하는 결합확률(질량)함수(joint probability function) $p_{X, Y}$를 다음과 같이 정의한다.
\[ p_{X,Y}(x,y) = P(X=x, Y=y) \]
joint probability function을 안다면, marginal probability function 역시 쉽게 구할 수 있다.
두 (이산)확률변수 $X, Y$의 joint probability function을 $p_{X, Y}$라 할 때 $X, Y$의 확률함수 $p_X, p_Y$를 다음과 같이 구한다.
\[ p_X(x) = \sum_{y }p_{X,Y}(x, y) \]
\[ p_Y(y) = \sum_{x} p_{X,Y}(x, y) \]
Proof
$P_X(x) = P(X = x) = \displaystyle\sum_{y}P(X=x, Y=y) = \sum_{y}p_{X, Y}(x,y)$
Example 2.7.5
joint probability function이 다음과 같이 정의되어있다.
\[ p_{X,Y}(x,y) = \begin{cases} 1/7 \qquad x=5,y=0 \\ 1/7 \qquad x=5,y=3 \\ 1/7 \qquad x=5,y=4 \\ 3/7 \qquad x=8,y=0 \\ 1/7 \qquad x=8,y=4 \\ 0 \quad \qquad \text{otherwise.} \end{cases} \]
확률분포표를 만들면 쉽게 확률을 구할 수 있다.
따라서 $P_X(5)=1/7 + 1/7 + 1/7 = 2/7$, $p_X(4)=3/7 + 1/7 = 4/7$, $p_Y(4) = 1/7+1/7=2/7$이다.
Joint Density Functions, 결합(밀도)함수
Joint Density Function
$f:\mathbb{R}^2 \to \mathbb{R}$가 $f(x, y) \ge 0$이고 $\int_{\infty}^{\infty}\int_{\infty}^{\infty}f(x, y) dxdy=1$을 만족하면 결합(밀도)함수라고 부른다.
joint density function을 이용하여 확률을 계산할 때는 아래와 같이 계산한다.
\[ P(a \le X \le b, \ c \le Y \le d) = \int_c^d \int_a^bf(x, y) dxdy \]
두 (연속)확률변수 $X, Y$의 joint density function을 $f_{X, Y}$라 하자. 이때 $X$, $Y$의 (marginal) density function은 아래와 같이 구한다.
\[ f_X(x) = \int_{-\infty}^{\infty}f_{X, Y}(x, y) dy \]
\[ f_Y(y) = \int_{-\infty}^{\infty}f_{X, Y}(x, y) dx \]
Example 2.7.8
joint density 가 아래와 같을 때, 물음에 답하여라.
\[ f_{X, Y}(x, y) = \begin{cases} 120x^3y \qquad x \ge 0. y \ge 0. x+y \le 1 \\ 0 \ \qquad \qquad \text{otherwises.} \end{cases} \]
(1) density function이 맞는가?
$\displaystyle\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f_{X,Y}(x,y)dxdy = \int_{0}^{1}\int_{0}^{1-x}120x^3y \ dydx = \int_{0}^{1}120x^3\cfrac{(1-x)^2}{2}dx=1$
따라서 $f_{X,Y}$는 결합밀도함수이다.
(2) $f_X(x)$를 구하여라.
$\displaystyle f_X(x)=\int_0^{1-x}120x^3y \ dy = 120x^3\cfrac{(1-x)^2}{2} = 10(x^3-2x^4+x^5) \ (0 \le x \le 1)$
※ 범위를 반드시 명시해야 한다.
'스터디 > 확률과 통계' 카테고리의 다른 글
다항분포, Multinomial Distribution (0) | 2023.03.23 |
---|---|
조건부확률과 독립 (Conditioning, Independence) (0) | 2023.03.23 |
확률변수의 변환, Change of Variable (0) | 2023.03.21 |
누적분포함수, Cumulative Distribution Function (CDF) (0) | 2023.03.21 |
연속확률분포, Continuous Distribution (0) | 2023.03.16 |