앞 글에서 이웃 기반 방법론의 수식에 대해서 간략히 설명했다. 이웃 기반 방법론은 사용자 기반 모델, 아이템 기반 모델이 존재하는데 일반적으로 아이템 기반 모델이 성능이 조금 더 좋다고 한다. 왜 그럴까? 총 3가지 이유를 거론할 수 있을 것이다.
1. 시간 복잡도
온라인 쇼핑몰을 보면 실제 사용자 수는 엄청나게 많지만 사용자 수에 비해서 아이템 수는 상대적으로 적은 것이 일반적이다. 우리가 NBCF(Neighbor Based Collaborative Filtering)을 구현할 때를 생각해보자.
2. 신규 유입
협업 필터링의 단점 중 하나라고 꼽을 수 있다. 신규 사용자나 아이템이 유입될 경우 유사도를 새로이 계산해야된다(새롭게 유입된 사용자 및 아이템에 평점이 부여될 경우). 사용자의 경우 자주 유입이 되지만 아이템의 경우 상대적으로 사용자에 비해서 새로운 아이템의 유입이 적다. 만약 사용자 기반 모델을 구현하게 된다면 모델을 자주자주 계산해주어야 되지만 아이템 기반 모델의 경우 급격한 변화가 될 이유가 없기 때문에 유사도 계산은 가끔 이루어져도 된다.
3. 근거
사용자 기반 모델의 경우 사용자(
확장성, 희박성 문제
NBCF는 단순하고, 직관적이므로 자주 사용되는 방법론 중 하나이다. 왜 해당 아이템이 고객에게 추천되었는지 알기 쉽고, 적용하기도 쉽다. 하지만 확장성(Scalability) 문제가 존재한다. 모든 관계를 계산해야되기 때문에 사용자의 수나 아이템의 수가 많을 경우 비효율적이다.
아이템 기반 모델이 사용자 기반 모델보다 좋다고는 하지만 아직까지 문제점이 존재한다. 또한 희박성(Sparsity) 문제도 존재한다. 예를 들어 아이템(
'Deep Learning > Recommender system' 카테고리의 다른 글
[Recommender System] 공분산(Covariance) (0) | 2022.02.16 |
---|---|
[Recommender System] 이웃 기반 방법론 - Cosine, Pearson (0) | 2022.01.17 |
[Recommender System] context of recommender systems (0) | 2022.01.17 |
[Recommender System] 협업 필터링(Collaborative Filtering) (0) | 2022.01.13 |
[Recommender System] Collaborative Filtering, Content-based, Knowledge-based (0) | 2022.01.03 |