본문 바로가기
728x90
반응형

스터디/확률과 통계57

분산, Variance 확률변수 $X$의 기댓값 $E(X)$를 구하는 법을 알았다.이제, $X$가 $E(X)$로부터 얼마나 멀리 떨어져 있는지에 대한 정보인 분산에 대해 알아보자. Variance, 분산\[ Var(X) = \sigma_X^2 = E\left[ (X - E(X))^2 \right]  = E(X^2)-\mu^2 \]Standard Deviation, 표준편차\[ Sd(X) = \sqrt{Var(X)} = \sigma_X \]Note: 경우에 따라 $Var(X)$대신 $V(X)$를, $E(X)$대신 $\mu_X$로 표기할 수 있다.Note: 분산의 단위는 $X$의 단위의 제곱이다.Note: 표준편차의 단위는 $X$의 단위와 같다. (1) 이항분포의 분산$E(X)=n\theta$임을 알고 있으므로, $E(X^2)$을.. 2023. 3. 30.
연속확률변수의 기댓값, Expectation of Continuous Case (Uniform, Exponential, Gamma, Normal) 연속확률변수의 기댓값도 이산확률변수와 거의 같다.Expected value, 기댓값연속확률변수 $X$에 대히여 pdf가 $f_X$일 때, $X$의 기댓값은 다음과 같다,\[ E(X) = \int_{-\infty}^{\infty}xf_X(x) dx \](1) 균등분포의 기댓값$X \sim U[a, b]$의 pdf는 $\frac{1}{b-a}$이므로 기댓값은\[ E(X) = \int_a^b \cfrac{x}{b-a} dx = \cfrac{a+b}{2} \] (2) 지수분포의 기댓값$X \sim Exp(\lambda)$의 pdf는 $\lambda e^{-\lambda x}$이므로 기댓값은 (부분적분을 이용하여)\[ E(X) = \int_0^{\infty}x \lambda e^{-\lambda x} = \lef.. 2023. 3. 30.
Order Statistics, 순서통계량 Order Statistics, 순서 통계량$(X_1, \dots, X_n)$이 i.i.d.한 분포에서 추출한 확률변수하고 하자. 많은 경우에, 우리는 확률변수의 값이 아니라 확률변수의 순서에 관심이 있을 때가 있다. 이런 경우 아래와같이 $1$번째부터 $n$번째 확률변수를 나열하면 다음과 같다.\[ X_{(1)}, \dots X_{(n)} \]$X_{(i)}$를 $i$번째 작은 확률변수이고, 당연히 $X_{(1)} \le X_{(2)} \le \cdots \le X_{(n)}$ 이다. 특별히, 표본 중앙값(sample median, median과는 다르다)은 $X_{(\left[ \frac{n}{2} \right])}$ 이다. Note: 중앙값(median, $m$)의 정의는 cdf $F$에 대하여, .. 2023. 3. 29.
이산확률변수의 기댓값, Expectation of Discrete Case (Bernoulli, Binomial, Geometric, Poisson) 앞서 Ch2에서 확률변수와 확률분포를 배웠다. 이제 유의미한 통계량인 기댓값에 대하여 Ch3를 할애했다.그리고 기댓값을 시작으로 분산, 공분산, 상관계수를 학습하고 적률생성함수(moment generating function, mgf)로 $k$차 적률($E(X^k)$)까지 유도해본다. Expected value, 기댓값이산확률변수 $X$에 대하여, 기댓값을 $E(X)$ 또는 $\mu_X$로 표기한다. \[ E(X) = \sum_{x \in \mathbb{R}}xP(X=x) = \sum_{x \in \mathbb{R}}xp_X(x) \]$p_i = P(X=x_i)$로 표기하면 다음과 같이 정의할 수 있다.\[ E(X) = \sum_{i}x_i p_i \]Note: 기댓값은 음수가 될 수 있다. Degene.. 2023. 3. 29.
다항분포, Multinomial Distribution Multinomial Distribution, 다항분포categorical variable에 대한 모델링에 유용한 분포다. $k$개의 범주(category)가 있고, $s$개의 반응(response)에 대하여 $P(s=i)=\theta_i$로 표기할 수 있다.$X_i$는 $n$개의 반응(response) 중에서 $s=i$인 반응의 개수이다. $(X_1, X_2, \dots, X_n) \sim \text{Multinomial}(n, \theta_1, \theta_2, \dots, \theta_k)$ \[ p(x, \dots, x_n) = \dbinom{n}{x_1\dots x_k}\theta_1^{x_1} \cdots \theta_k^{x_k} = \cfrac{n!}{x_1! \times \cdots \t.. 2023. 3. 23.
조건부확률과 독립 (Conditioning, Independence) Section 8. Conditioning and Independence. 조건부확률과 독립Conditional distribution of $Y$ given $X=x$\[ P(Y \in B | X=x) = \cfrac{P(Y \in B, X=x)}{P(X=x)} \]Conditional distribution - Discrete\[ p_{Y|X}(y|x) = \cfrac{p_{X,Y}(x,y)}{p_X(x)} \]Conditional distribution - Continuousconditional density of $Y$, given $X=x$\[ f_{Y|X}(y|x) = \cfrac{f_{X,Y}(x,y)}{f_X(x)} \]따라서 확률 $P(a \le Y \le b|X=x)$를 구하면\[ P(.. 2023. 3. 23.
728x90
반응형