본문 바로가기
스터디/확률과 통계

분산, Variance

by 궁금한 준이 2023. 3. 30.
728x90
반응형

 

 

확률변수 X의 기댓값 E(X)를 구하는 법을 알았다.

이제, XE(X)로부터 얼마나 멀리 떨어져 있는지에 대한 정보인 분산에 대해 알아보자.

 

Variance, 분산
Var(X)=σX2=E[(XE(X))2]=E(X2)μ2

Standard Deviation, 표준편차
Sd(X)=Var(X)=σX
Note: 경우에 따라 Var(X)대신 V(X)를, E(X)대신 μX로 표기할 수 있다.
Note: 분산의 단위는 X의 단위의 제곱이다.
Note: 표준편차의 단위는 X의 단위와 같다.

 

(1) 이항분포의 분산

E(X)=nθ임을 알고 있으므로, E(X2)을 통해 분산을 계산하자.

E(X2)=0nx2(nx)θx(1θ)nx

그런데 기댓값에서의 계산과 달리 x2은 팩토리얼 연산으로 소거가 되지 않는다.

따라서 E(X(X1))을 통해 계산해보자.

 

E(X(X1))=0bx(x1)(nx)θx(1θ)nx=n(n1)[1n(n2)!(x2)!(nx)!θx2(1θ)nx]θ2=(θ+1θ)n2n(n1)θ2=n(n1)θ2

 

E(X2)=E(X(X1))+E(X)=(n2n)θ2+nθ

따라서 분산은 

Var(X)=nθ(1θ)=npq (p+q=1)

 

(2) 감마분포의 분산

먼저 E(X2)를 구하면

E(X2)=0x2λαΓ(α)xα1eλxdx=[0xα+21eλxλα+2Γ(α+2)dx]Γ(α+2)λα+2λαΓ(α)=(α+1)αλ2

 

따라서 분산은 

Var(X)=(α+1)αλ2(αλ)2=αλ2

 

Properties of Variance

(1) Var(X)0
(2) Var(aX+b)=a2Var(X)
(3) Var(X)=E(X2)E(X)2
(4) Sd(aX+b)=|a|Sd(X)

(3) 정규분포의 분산

ZN(0,1)이고 X=σZ+μ일 때,

E(X)=μ,Var(X)=σ2

 

 

평균과 분산은 어떤 분포의 특성을 정확하게 반영한다.

예를 들어, 미지의 분포의 평균과 분산이 각각 1020이라면, 이 분포는 절대로 포아송분포가 될 수 없다.

왜냐하면 포아송분포는 평균과 분산이 둘다 λ로 동일한 분포이기 때문이다. (만약 그렇다면, 분포를 새로 정의해야 할 것이다.)

728x90
반응형