[태그:] 단어 유사도

TF-IDF (Term Frequency – Inverse Document Frequency)

I. 검색엔진 스코어 알고리즘, TF-IDF 가. TF-IDF(Term Frequency – Inverse Document Frequency) 개념 핵심어 추출 및 검색 결과 순위 결정을 위해 단어의 특정 문서 내 중요도를 산출하는 통계적 가중치 알고리즘 나. TF와 IDF의 개념 TF(Term Frequency) IDF(Inverse Document Frecuency) – 단어의 문서 내 등장빈도 – 고빈도 출현시 중요도 높음 – 문서 빈도수(DF)의 역수값 – DF

Word2Vec

I. word embedding 성능 향상, Word2Vec 가. Word2Vec의 개념 단어를 벡터 평면에 배치하여 컴퓨터가 인식할 수 있도록 문맥적 의미를 보존하는 워드임베딩 기법 – 출력 스코어에 Softmax 적용하여 정답과 비교해 역전파 수행   II. Word2Vec 신경망 연산 기법 및 학습 모델 가. Word2Vec의 신경망 연산 기법 – 은닉 벡터(h) = 입력(x) x 입력 가중치 행렬(W) –