2018년 12월 17일
NLU (Natural Language Understanding)
1. 인간의 언어 이해, NLU
(1) NLU의 개념
- 인간의 언어 이해 방법을 모방하여 자연어의 어휘/문장/문맥을 이해하는 자연어 이해 기술
(2) NLU 방법론 특징
| 인간 모방 | – 인간 언어 이해 방법 모방한 자연어 이해 |
| 파이프 라인 | – 어휘 → 구문 → 문맥 차례 인식 |
| 하이브리드 | – 사전 + 패턴 분석, 기계학습 |
2. NLU의 구성도 및 처리 절차
(1) NLU의 구성도
![]() |
(2) NLU 처리 절차
| 단계 | 절차 | 설명 |
|---|---|---|
| 전처리 | 전처리(파싱) | – 문장부호 전처리, 파싱 |
| ① 어휘 이해 | 형태소 분석 | – 음절 기반, 기분석 사전 |
| 어휘 인식/분석 | – 사전/규칙, 기계학습 | |
| ② 문장 이해 | 구문 분석 | – 트렌지션, 문장유형기반 |
| 의미역 인식 | – 문장 의미 애매성 해소 | |
| ③ 문맥 이해 | 상호참조 해결 | – 대명사 의미 참조 기법 |
| 무형대용어 복원 | – 생략된 단어 복원 기법 |
3. NLU 기술요소
| 기술요소 | 세부 기술 | 설명 |
|---|---|---|
| 워드 임베딩 | – Word2Vec – CBOW, Skip-gram | – 자연어 단어 벡터화 – 의미 간 거리 차이 |
| 문장 분류 | – RNN – LSTM, GRU | – 시계열 데이터 처리 – 긴 문장 학습 어려움 |
| Seq2Seq | – Attention – Encode/Decode | – 자연어 문장 입/출력 – 생각 벡터 기반 출력 |
| MRC | – Pointer Network – Match-LSTM | – 지문 학습, 답변 추론 – 이해→관계파악→답변 |
4. 자연어 심층 이해를 위한 인공지능 기술
| AI 기술 | 설명 |
|---|---|
| DNN, CNN | – 구조적 분류로 신경망 구조 확장 |
| RNN, LSTM | – Vanishing Gradient 문제 해결로 문맥 이해 |
| K-means | – 지도 학습으로 학습 자질 제고 |
