Method of Moments & Maximum Likelihood Estimate
간단하게 적률추정법(MOM)과 최대우도추정법(MLE)를 설명하고 비교해보자.

Notation
공통되는 notation 정리
Method of Moments (MOM, MME)
관측된 데이터셋가 unknown parameter 에 의해 생성되었다고 하자.
이때 parameter 개수에 따라를 계산하여 parameter를 계산한다.
일반적으로 일변수의 경우만 계산해도 충분하며, parameter가 2개인 경우 와 을 연립하여 parameter를 추정한다.
Example: Uniform distribution
적률추정법을 이용하여
그러나 우리가 추정한
적률추정법은 쉽고 합리적(sensible)이지만, 항상 적절한 값으로 추정하는 것은 아니다.
Maximum Likelihood Estimate (MLE)
관측된 데이터셋가 개의 unknown parameter 에 의해 생성되었다고 하자. 이때 jointly likelihood function은 다음과 같다.
이때의 값이 최대가 되는 로 parameter를 추정한다.
Example: Normal distribution
정규분포는 parameter가 2개인 분포함수다.
likelihood를 구하면
일반적으로 미분이 가능한 경우, log-likelihood를 이용하여 미분 계산을 쉽게 한다.
원래 식이 이차식이므로 위 식이 최솟값이 되는
위에서 구한
Example: Uniform distribution
위에 적률추정법으로 추정한
MLE로 추정한 값은
따라서 MLE로 추정한 값은 reasonable하다고 할 수 있다.
Does MLE always win?
그러면 MLE만 사용하면 되는 것 아닌가?
그렇지 않다.
Example: Beta distribution
MLE로 두 parameter
log-likelihood를 구하면
여기서
일반적으로 감마함수를 직접 미분하는것은 불가능하고, 특별한 방법을 이용하여 구할 수 있다.
(
(그리고
실제로는 gradient descent와 같은 별도의 최적화를 통해 parameter
(그래서 통계 연습문제의 베타분포의 추정은
method of moments를 이용해서 베타분포의 parameter를 추정해보자.
임을 알고 있으니 이를 이용한다.
주어진 데이터를 통해
이라는 추정량을 (비교적 쉽게) 얻을 수 있다.