
The Central Limit Theorem
The Central Limit Theorem (CLT, 중심극한정리)가 i.i.d이고 유한한 평균과 분산이 각각 이라 하자. sequence 이
라 하면,은 표준정규분포로 분포수렴한다.
(where )
Note: 표본표준편차는이므로 으로 표기하는 경우도 있다.
Note:가 어떤 분포를 따르던지 i.i.d이면 CLT가 성립한다.
그런데 직접
Corollary이고 이라 하고
이고라 하자. 그러면
이다.
Moment를 이용한 증명
확률변수의 합의 mgf는 각각의 mgf의 곱과 같으므로
(Tayler series 근사와
이는
(1) Binomial to Normal
따라서
Continuity Correction (연속성 수정, correction for continuity)
CLT에 의하여 이산분포를 연속분포로 근사하기에 구간 대응이 완벽하지 않다.
누적분포함수 관점에서 보면 아래와 같다. (
이 때
따라서 아래와 같이 수정하여 계산할 수 있다.
Example
이항분포의 pmf를 이용하여 직접
(2) Poisson to Normal
이제
그리고
Assessing Error using CLT
표준정규분포에서
따라서
그런데 실제 기댓값
우선,
이 경우, 표본비율(sample proportion)을
이때 사용한 (진짜는 아니지만)
이 경우, sample mean에 대한 standard error이므로 standard error of the estimate sample mean이라 하고
일반적으로 표준편차를 모르는 경우, 다음 식을 이용하며, 표본표준편차(제곱하면 표본분산)이라 한다. (이렇게 되는 이유는 추정 단원에서 다룬다)