본문 바로가기
스터디/확률과 통계

Maximum Likelihood Estimation (MLE, 최대우도추정법)

by 궁금한 준이 2023. 5. 17.
728x90
반응형

 

 

Maximum Likelihood Estimator

L(θ^(s)|s)L(θ|s)를 만족하는 θ^:SΩ를 maximum likelihood estimator라 하고, θ^(s)의 값을 maximum likelihood estimate, (MLE)라고 부른다.

Example 6.2.1.

표본공간은 S={1,2,3}이고 파라미터공간은 Ω={1,2}인 두 개의 model이 다음과 같다.

Table for Example 6.2.1

s마다 L이 가장 클 때를 조사하면 θ^(1)=1, θ^(2)=2, θ^(3)=1

Note: MLE는 유일하지 않다. (위 예제에서 f2(s=1)=0, f2(s=2)=0.7, f3(s=3)=0.3이라 하면 θ^(3)=2 역시 가능하다.) 
Reparameterization

θ^가 MLE이고 ψΩ에서 정의된 1-1 fuction이라 하면 ψ^(s)=ψ(θ^(s)) 역시 MLE이다.

이를 이용하면 θ에 대한 (1-1 함수)함수의 MLE를 쉽게 구할 수 있다.

θ^를 구할 수 있다면, log^θ 역시 MLE이다.

 

Computation of the MLE

L(θ|x)를 최대로 하는 θ가 MLE이다. 그러나 L(θ|x)의 최솟값을 직접 구하는것은 쉽지 않은 경우가 많다. (특히 i.i.d.) 위의 reparameterization을 이용하여 log-likelihood를 이용하면 쉽게 계산할 수 있다.

Log-likelihood function

l(|x)=logL(|x)
를 log-likelihood라 한다.
Note: 주로 편미분(과 이계도함수)을 이용하여 l(|x)의 최솟값(global minimum)이 되는 θ^=θ를 구한다.

MLE of Uniform distribution

Indicator function 1A(x): xA이면 1을, xA이면 0을 return하는 함수이다.

1[ai,bi](x)은 전체 결과가 1이 되도록 구간 [a,b]을 조정한다.

 

Uniform의 pdf는 f(x;θ)=1θ(0,θ](x)이지만, MLE로 θ를 구해야 하므로 구간을 x에 대한 식으로 바꾸면 f(x;θ)=1θ[x,)(θ) 이다. (0xθxθθ의 식 위주로 변형)

 

(x1,,xn)U[0,θ]의 sample일 때 MLE를 구해보자.

likelihood function을 구하면

L(θ|x1,,xn)=(1θ)n1[xi,)(θ)=1θni=1n1[xi,)(θ)=1θn1[x(n),)(θ)

 

의 결과가 1이 되기 위해서는 θ가 모든 구간에서 포함되어야 한다.

예를 들어 xi=1,2,3,4,5일때 θ=3.5[4,), [5,)에서 0이므로 1[xi,)(θ)=1302=0이므로 0이 되어버린다.

따라서 indicator의 결과는 [max(xi),)=[x(n),)이다.

 

마지막으로, L(θ)θ<x(n)에서 0이고, θx(n)에서 (1θn)이므로 L(θ|x)가 최대가 되는 θ^MLE=x(n)이다.

이 경우 log-likelihood를 이용하지 않아도 MLE를 구할 수 있다. (log-likelihood를 이용하여도 감소함수라는 정보밖에 얻을 수 없다.)

반응형

Exponential distribution

(x1,,xn) Exp(λ)의 sample일 때 MLE를 구해보자.

likelihood를 구하면

L(θ|x1,,xn)=i=1nλeλxi

log-likelihood를 구하면

l(λ|x1,,xn)=nlogλλi=1nxi

l(λ|x)λ=nλi=1nxi=0.λ^=ni=1nxi=1/x 이므로 λ^에서 극값을 갖고,

2l(λ|x)λ2=nλ<0 이므로 λ^에서 최솟값을 갖는다.

따라서 MLE는 λ^=1/x 이다.

 

Normal distribution

정규분포는 2개의 parameter μ,σ2을 갖는다. 즉 2개의  MLE μ^, σ2^를 구해보자.

likelihood를 구하면

L(μ,σ2|x)=(2πσ2)n/2exp[n(xμ)22σ2]exp[i=1n(xix)22σ2]

log-likelihood를 구하면

l(μ,σ2|x)=n2log(2πσ2)n(xμ)22σ2i=1n(xix)22σ2

 

μ의 MLE를 구해보자.

l(μ,σ2|x)μ=2n(xμ)2σ2=0.μ^=x

 

σ2의 MLE를 구해보자.

l(μ,σ2|x)σ2=n2σ2+i=1n(xix)22σ4=0.σ^2=1ni=1n(xix)2

Note: MLE로 구한 정규분포의 분산의 추정량은 biased estimator이다.

 

728x90
반응형