베이즈 규칙을 알아보기 전 우리가 기본적으로 알아야할 개념들부터 짚고 넘어가자. 우리는 일반적으로 확률을 지칭할 때
결합 확률과 독립
확률에서의 독립이라는 개념은 두 값이 떨어져있다라는 개념으로 받아들이면 큰 문제가 생긴다. 확률에서의 독립이란, 두 사건 사이에 아무런 연관성이 없다는 뜻이며 사건 A가 일어나는 것과 사건 B가 일어나는 것이 서로 관련이 없다는 뜻이다. 서로 독립적인 경우에는
조건부 확률
조건부 확률(Confidence Probability)은 이공계열이 아니더라도 이미 많이 들어봤을 것이라 생각이 든다.
베이즈 규칙
베이즈 규칙을 도출해내기 위해서는 결합 확률과 조건부 확률을 알고 있어야 접근이 가능하다. 아래의 수식에 대해 이해를 돕기 위해
이 수식에서 B는 우리가 평가하고자 하는 가설(사후확률), A는 우리가 이미 알고 있는 확률(사전확률)이라고 하고 사전확률을 E, 사후확률을 H로 놓으면 수식은 다음과 같다.
우리는 이 수식을 베이즈 규칙
왜 베이즈 규칙을 사용할까?
왜
우리가 의사인데 붉은 반점이 있는 환자가 병원에 방문했다. 우리는 환자가 홍역에 걸렸다고 생각한다(가설). 기존에 주어진 증거(E = 붉은 반점)가 있을 때 우리가 세운 가설(H = 홍역)의 확률을 결정하려고 한다.
위 경우와 베이즈 규칙을 사용한 경우와 비교하면
응용
이제는 베이즈 규칙을 분류 문제로 바꾸어 풀어보자. 분류 문제의 경우
1. 주관적인 사전 확률. 의사 결정자의 지식, 경험, 의견에 따라 결정
2. 이전에 다른 증거를 통해 베이즈 규칙을 적용해 알게된 결과에 기반
3. 데이터에 기반해 추론한 무조건적인 확률
여기서 우리는 E를 상당히 큰 조건의 집합인
나이브베이즈
나이브베이즈는 사건들이 모두 독립이라는 가정하에 베이즈 규칙이라고 보면 된다. 만약에 독립성을 가정하지 않는다면 아래와 같은 식으로 표현할 수 있다.
=
만약 독립성이 가정되지 않는다면 위와 같은 형태의 체인룰을 사용하여 계산하는 방법 밖에는 없다. 하지만 확률에 대한 동립성을 가정하게 되면 식은 다음과 같이 간단하게 표현할 수 있다.
이렇게 수식을 변경할 수 있으면 확률을 계산할 수 있는 방법이 상당히 달라진다.
위 처럼 뜯어서 계산할 수 있을 것이다. 위 식을 결합 시키면 나이브 베이즈 방정식을 얻게 된다.
예제를 한 번 생각해보자. 예를 들어 호텔에 예약하는 경우를 예측하고 싶으면 호텔방을 예약하거나 예약하지 않는 경무만 존재한다. 쉽게 말해
우리는 각각의 사전확률을 독립적이라고 가정하고 있으므로, 이 수식을 다음과 같이 바꿀 수 있다.
위 수식들을 합치면 다음과 같은 나이브 베이즈 방정식이 나온다.
위 식을 향상도로 바꾸어 표현하면 다음과 같은 수식이 도출된다.
이렇게 앞서 다루었던 향상도를 베이즈 규칙과 합쳐 나이브- 나이브 베이즈 모델로도 만들 수 있다.
'Mathematics > Statistics' 카테고리의 다른 글
[Statistics] T test with R (0) | 2021.09.23 |
---|---|
[Bayesian] Gaussian process (0) | 2021.08.08 |
[Bayesian] Bayesian Deep Learning - Functional analysis (0) | 2021.07.13 |
[Bayesian] Bayesian Deep Learning - Random Process (0) | 2021.07.12 |
[Bayesian] Bayesian Deep Learning - Random variable (0) | 2021.07.09 |