Deep Learning

[Deep Learning] RBF : Radial basis function

언킴 2022. 3. 21. 10:46
반응형

RBF는 SVM을 다룰 때도 많이 언급되는 내용이다. 딥러닝에서의 RBF 뉴럴네트워크란 Gaussian basis function을 이용하는 것으로, μσ를 가지는 정규분포의 선형결합으로 데이터의 분포를 근사하는 것을 의미한다. 일반적인 MLP는 초평면으로 데이터를 분할하지만, RBF 뉴럴네트워크의 경우 각 데이터에 맞는 Kernel function을 이용하기에 비선형적이고, MLP보다 학습이 빠르다.

 

 

저차원 공간에서 선형 분리가 되지 않는 데이터를 분리하고자 하면 고차원으로 확장해 초평면을 도입해 분리하는 등의 형태로 분리할 수 있는데, 이때 저차원 공간의 데이터를 고차원 공간으로 매핑시켜주는 함수가 바로 커널 함수(Kernel function)이다. 커널 함수는 Gaussian basis function이 가장 널리 사용되는 함수이며, Linear kernel, Polynomial kernel, Sigmoid kernel 등 여러 커널 함수가 존재한다. 아무 함수나 커널 함수가 될 수는 없고, L 공간 상의 벡터 x,y가 있다고 할 때 K(x,y)=M(x)M(y)를 만족하는 함수 M()이 존재할 때 우리는 이 매핑 함수를 커널 함수로 정의할 수 있다. 즉, 커널 함수의 값과 고차원 공간으로 매핑된 두 점 M(x),M(y)의 내적이 같아야 한다. 

 

이와 같이 커널 함수를 찾기 위해서는 내적이라는 연산이 필요하다. 그렇기 때문에 내적이 불가능하면 커널 함수를 정의할 수 없다. 다르게 말하면 내적을 사용하는 방법에는 모두 커널 함수를 사용할 수 있다. 이처럼 저차원 공간을 고차원 공간으로 변환시키는 방법을 우리는 '커널 트릭' 이라고 칭한다. 만약 고차원 공간에서의 거리를 계산할 수 없다면, 저차원 공간에서 계산해도 고차원 공간에서의 거리와 동일하게 나타날 것이다. 

'Deep Learning' 카테고리의 다른 글

퍼셉트론(Perceptron)  (0) 2022.05.06
Object Function, Cost Function, Loss Fuction  (3) 2022.04.28
[Deep Learning] Restricted Boltzmann Machines(RBM)  (1) 2022.03.08
Multi-layer Perceptron (MLP)  (0) 2021.06.21