인공지능 음성인식 기술

인공지능 음성인식 기술

I. AI 기반 음성비서 서비스, 인공지능 음성인식 기술

– 사람의 음성을 인공지능 기반 패턴화, 기계학습을 통해 업무 보조, 생활 편의 서비스 제공 기술

 

II. 인공지능 음성인식 기술 분류

가. 음성처리 측면의 기술

구분음성인식 기술설명
자연어
인식
word2vec– 벡터 평면 배치, 워드임베딩
– CBOW, Skip-gram 방식
NLU– 전처리, 형태소 분석
– 어휘 분석 및 구문 분석
자연어 처리
및 생성
대화형 플랫폼
NMT, NLP
– 인공신경망 번역 기술
– 은닉층 별 데이터 재배치
자연어 생성
NLG
– 자연어 의미 표현 생성
– 자연어 생성후보 검색 및 선택

나. 인공지능 측면의 기술

구분인공지능 기술설명
음성기반
딥러닝기술
RNN
(Sigmoid, ReLu)
LSTM 기반 인공신경망
– 시계열 데이터 분석
RBM
(겹층 DBN)
– 다층 퍼셉트론
– 겹층 DBN 기반 오류역전파
음성패턴
분류기술
패턴 분류KNN, SVM, 의사결정트리
– 앙상블 학습(Bagging, Boosting)
군집화DBSCAN
K-means, K-medoids

 

III. 인공지능 음성인식 기술의 활용

가. 음성 비서 측면 기술의 활용

구분활용 기술활용 내용
업무
보조
인공신경망
통역 기술(NMT)
– 자동 언어 감지
– 기계학습 기반 통/번역
음성 뱅킹
로보 어드바이저
– 비대면 인증, FIDO, 뱅킹
– 투자, 신탁 등 금융 상담
가정
비서
영화, 음악
큐레이션 서비스
– 기계학습 기반 패턴 분석
– 목소리 패턴 감정 분석
날씨, 주식
정보 서비스
– GPS기반 날씨, 환율 정보
– 음성 예보 서비스

나. 스마트홈 측면 기술의 활용

구분활용 기술활용 내용
가전
제어
Wi-Fi, ZigBee
BLE, Zing
– 가전 제품 원격 제어
AMQP 기반 기기 제어
스마트미터
AMI, HEMS
– 실내/외 날씨, 시간 반영
– 가정 내 전등/공조 제어
멀티
미디어
자동차
인포테인먼트
– V2I, IVN 기반
– 모국어 자동 통역 기술
NMT 기반
통역/자막 서비스
NLU 기반 문맥 인지
NLG 통한 자막 생성

 

IV. 인공지능 음성인식 기술 동향 및 전망

가. 인공지능 음성인식 기술 동향

구분기술 동향사례
해외스타트업 인수
독자 플랫폼 개발
– Apple Siri, Amazon Echo,
Google Home, MS Cortana
국내제품, 음성비서
결합 서비스
– SKT NUGU, KT 기가지니
– 삼성 빅스비 등

나. 인공지능 음성인식 기술 전망

구분기술 전망설명
단기
전망
날씨, 주식 등
단순 대화
– AI 스피커 위주 초기 시장
– 스마트폰, hearable 기기
스마트 홈
서비스
– RNN 기술 단편적 적용
– 명령-수행 기반 서비스
장기
전망
자동 동시
통/번역
– AI 기술의 발전
NLU, NLG 기반 문맥 인식
뇌파/영상
인식과 융합
– 종합 인식기술 발전
BCI, 컴퓨터 비전 등 융합

– 국내 기업의 글로벌 경쟁력 위해 독자 S/W 플랫폼 개발, 한국어 적합 툴 연구/개발 필요

2 Comments

콘텐츠 사용 시 출처 표기 부탁 드리고, 댓글은 큰 힘이 됩니다^^