I. 인공신경망 번역 기술, NMT
가. NMT(Neural Machine Translation)의 개념
- 인공신경망을 활용한 기계학습을 통해 언어 번역 모델 생성 및 번역 서비스 제공 기술
나. NMT의 원리
- 머신러닝 기술이 적용된 엔진을 통해 전체 문맥 파악 후 문장 내 단어, 순서, 문맥 의미차이 등 반영하여 문장단위 결과 출력
II. 인공신경망 번역 원리 및 구성 요소
가. 인공신경망 번역의 원리
① 기계어 재조합된 문장A를 문장C로 번역
② A 영역의 단어들을 숫자화 후 순서 재조합
③ A 영역의 모든 숫자를 Rule 1로 적용, B 영역 숫자로 재배치
④ B 영역의 모든 숫자를 Rule 2로 적용, C 영역 숫자로 재배치
나. 인공신경망 번역의 구성 요소
|
구성요소 | 설명 |
입력데이터 | – 음성, 이미지, 다양한 문서(오피스 등) |
입력처리기술 | – 자동 음성 인식, 광학문자인식, 필터링 |
Hybrid 엔진 | – 정규화, 음차, 언어감지, 구문분석기 등 |
언어 Resource | – 대용량 코퍼스(말뭉치) 사전 수집 |
기계학습 | – 고객 자산(메모리 등)으로 번역 품질 강화 |
III. 대표적 NMT의 비교
항목 | 네이버 파파고 | 구글 번역 |
방식 | – 인공신경망 번역, M2MT 엔진 | – 인공신경망 번역, GNMT 엔진 |
특징 | – 한국어 특유 생활 언어 번역 | – 안정적 문장 번역, 문장이 길어도 자연스러움 |
언어 | – 한/영/중/일(4개 국어) | – 한/영/프/독/스/중/일 등 |
- 구글은 긴 문자 번역에 강점, 네티버는 신조어에 능통 특징
View Comments (1)
NMT내용이 너무 어려웠는데 간단하게 정리해주셔서 감사합니다^^ 혹시 자료에 활용된 그림 출처좀 알려주실 수 있으신가요??