NER
개체명 인식은 문장에서 Location, Person, Organization 등 개체명

Window Classification 에는 크게 2가지 방법론이 있다. 첫 번째 방법은 다음과 같다.
일단 먼저 단어가 4차원의 vector로 임베딩 되었다고 하고, window size는 2로 설정했다. '가방'이라는 단어를 기준으로 양 옆 window size 만큼 단어를 고려한다고 하면, 총 5개의 단어를 고려하게 된다. 4차원으로 된 각각 단어를 합해서 평균을 내주는 Average the word vectors in a window 방식이 있다. 평균을 취해버리는 방식을 사용하게 되면 그 단어가 어디에 위치해있는지에 대한 위치 정보를 잃어버리기 때문에 주의해야한다.

두 번째 방법은 위와 같이 4차원의 vector의 평균을 구하는 것이 아니라 각 vector를 concatenate해 4x5, 20차원의 vector로 이용하는 것을 볼 수 있다. 딥러닝 모델로 두 번째 방법을 만들어보면

'Deep Learning > CS224N' 카테고리의 다른 글
[CS224N] Machine Translation (MT), Attention (0) | 2021.09.03 |
---|---|
[CS224N] Language Model (n-gram, NNLM, RNN) (0) | 2021.09.01 |
[CS224N] Parsing (0) | 2021.08.31 |
[CS224N] cound based Word Prediction model (GloVe) (0) | 2021.07.22 |
[CS224N] SVD, Word2Vec를 통한 NLP (0) | 2021.07.20 |