목록Deep Learning/이론 (14)
Patrick's 데이터 세상
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bDwSa2/btqOuHyOqQ4/KrzMX92Px7yq0RdfOSwflK/img.png)
Word2vec Word2vec은 단어 임베딩 모델들 중 대표적인 모델입니다. 단어 임베딩을 학습하는 알고리즘에는 여러 가지가 있는데 GloVe, FastText 등이 있습니다. 그중 가장 자주 쓰이고 가장 유명한 방식은 word2vec입니다. Word2vec 알고리즘은 신경망 모델을 사용하여 큰 텍스트 코퍼스에서 단어 연관성을 학습합니다. 일단 학습되면 이러한 모델은 동의어 단어를 감지하거나 부분 문장에 대한 추가 단어를 제안할 수 있습니다. 이름에서 알 수 있듯이 Word2vec는 벡터라고 하는 특정 숫자 목록을 사용하여 각각의 고유 한 단어를 나타냅니다. 벡터는 간단한 수학 함수(벡터 간의 코사인 유사성)가 해당 벡터가 나타내는 단어 간의 의미 유사성 수준을 나타내도록 신중하게 선택됩니다. 아이디어..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/HbLe5/btqOt1db6aF/epz7dKn26UXVY0551KSp40/img.png)
단어 임베딩 모델(Word Embedding Model) 자연어를 처리할 때는 텍스트 기반의 모델을 만들어 텍스트를 숫자로 바꾸어 알고리즘으로 처리하게 됩니다. 이렇게 단어를 벡터로 바꾸는 모델을 단어 임베딩 모델(Word Embedding Model)이라고 부릅니다. 단어의 의미를 최대한 담는 벡터를 만들려는 알고리즘이 단어 임베딩 모델이라고 할 수 있습니다. 현대적인 자연어 처리 기법들은 대부분 이 임베딩 모델에 기반을 두고 있습니다. 데이터는 대상의 속성을 표현해놓은 자료입니다. 예를 들어 꽃에 대한 정보가 있는 데이터가 있으면 그 정보는 꽃의 모양, 색깔, 길이 등과 같은 속성이 담겨있을 것입니다. 이 정보를 바탕으로 어떤 꽃인지 판별하는 모델을 만들 수 있습니다. 이렇게 대상의 속성을 표현하는 ..