Mathematics/Statistics

[Statisctics] Maximum Likelihood Estimate

언킴 2021. 6. 29. 00:03
반응형

MLE란?


Maximun Likelihood method라고도 불리며, 최대우도법이라고 한다. 어떤 사건이 일어날 가장 높은 확률 값을 찾는 것이라고 볼 수 있다. 어떤 모수 θ로 결정되는 확률변수의 모임 Dθ=(X1,X2,...,Xn)이 있고, Dθ 의 확률변수가 f라고하면 f에 대해서 가능도 Lθ는 다음과 같이 표현할 수 있다.

 

Lθ=fθ(x1,x2,...,xn)

θ^=argmaxL(θ)θ

 

만약 X1,X2,...,Xn이 모두 independent 하고 같은 확률분포를 가진다면 L(θ)=Ni=1fθ(xi) 로 표현이 가능하다. 그리고 위 값을 계산하기 편하게 하기 위하여 log값을 취하게 된다. ( log를 취해주게 되면 곱 형태가 덧셈형태로 변형되기 때문에 계산하기 용이하다 )

 

Deep Learning 에서는 MLE를 가지고 Cross Entropy를 계산하거나 -1 을 곱해주어서 최소값을 찾는 Loss function으로도 사용한다. ( input value 가 이산형일 경우 사용을 한다. 연속형일 경우는 GD )

- cross Entropy, Gradient Descent 는 다음에 다뤄보도록..

 

예제 1 : Binomial

 

XB(n,θ) 라고 하자. fθ(xi)=(nk)θk(1θ)nk 가능도 함수는 L(θ)L(θ)=Ni=1fθ(xi) 가 된다.

θ^=argmaxL(θ)θ=argmaxlnL(θ)θ , lnL(θ)max가 되는 θ를 찾으면 된다.

 

θ(ln((nk)θk(1θ)nk))

 

= θ(ln(n!k!(nk)!+ln(θk)+ln((1θ)nk)) 

 

= kθ+nkθ1 = 0 

 

 k(θ1)+(nk)θ=0

 

kθk+nθkθ=0

 

i.e. θ=kn

 

 

예제 2 : Gaussian distribution

위와 동일한 방법으로 진행할 것이다. 가우시안 분포에 변수는 μσ가 있기 때문에 μ,σ에 대해 각각 최댓값을 찾을 수 있는 식을 구할 수 있다.

 

fθx=12πσ2e(xμ)22σ2

 

  L(θ)=Ni=112πσ2e(xiμ)22σ2

 

 lnL(θ)=Σln(12πσ2e(xiμ)22σ2)

 

= Σ(ln(12πσ2)+ln(e(xiμ)22σ2))

 

= ln(n2πσ2)Σ(xiμ)22σ2

 

 

Lμln(L(θ))=μ(ln(n2πσ2)Σ(xiμ)22σ2)

 

= Σ1σ2(xiμ)=0

 

i.e. μ^=Σxin

 

 

 

Lσln(L(θ))=σ(ln(n2πσ2)Σ(xiμ)22σ2)

 

= nσ+1σ3Σ(xiμ)2 = 0

 

i.e. σ2^=ΣNi=1(xiμ)2n