X

인공지능 음성인식 기술

인공지능 음성인식 기술

I. AI 기반 음성비서 서비스, 인공지능 음성인식 기술

– 사람의 음성을 인공지능 기반 패턴화, 기계학습을 통해 업무 보조, 생활 편의 서비스 제공 기술

 

II. 인공지능 음성인식 기술 분류

가. 음성처리 측면의 기술

구분 음성인식 기술 설명
자연어
인식
word2vec – 벡터 평면 배치, 워드임베딩
– CBOW, Skip-gram 방식
NLU – 전처리, 형태소 분석
– 어휘 분석 및 구문 분석
자연어 처리
및 생성
자연어 처리
NMT, NLP
– 인공신경망 번역 기술
– 은닉층 별 데이터 재배치
자연어 생성
NLG
– 자연어 의미 표현 생성
– 자연어 생성후보 검색 및 선택

나. 인공지능 측면의 기술

구분 인공지능 기술 설명
음성기반
딥러닝기술
RNN
(Sigmoid, ReLu)
– LSTM 기반 인공신경망
– 시계열 데이터 분석
RBM
(겹층 DBN)
– 다층 퍼셉트론
– 겹층 DBN 기반 오류역전파
음성패턴
분류기술
패턴 분류 – KNN, SVM, 의사결정트리
– 앙상블 학습(Bagging, Boosting)
군집화 – DBSCAN
– K-means, K-medoids

 

III. 인공지능 음성인식 기술의 활용

가. 음성 비서 측면 기술의 활용

구분 활용 기술 활용 내용
업무
보조
인공신경망
통역 기술(NMT)
– 자동 언어 감지
– 기계학습 기반 통/번역
음성 뱅킹
로보 어드바이저
– 비대면 인증, FIDO, 뱅킹
– 투자, 신탁 등 금융 상담
가정
비서
영화, 음악
큐레이션 서비스
– 기계학습 기반 패턴 분석
– 목소리 패턴 감정 분석
날씨, 주식
정보 서비스
– GPS기반 날씨, 환율 정보
– 음성 예보 서비스

나. 스마트홈 측면 기술의 활용

구분 활용 기술 활용 내용
가전
제어
Wi-Fi, ZigBee
BLE, Zing
– 가전 제품 원격 제어
– AMQP 기반 기기 제어
스마트미터
AMI, HEMS
– 실내/외 날씨, 시간 반영
– 가정 내 전등/공조 제어
멀티
미디어
자동차
인포테인먼트
– V2I, IVN 기반
– 모국어 자동 통역 기술
NMT 기반
통역/자막 서비스
– NLU 기반 문맥 인지
– NLG 통한 자막 생성

IV. 인공지능 음성인식 기술 동향 및 전망

가. 인공지능 음성인식 기술 동향

구분 기술 동향 사례
해외 스타트업 인수
독자 플랫폼 개발
– Apple Siri, Amazon Echo,
Google Home, MS Cortana
국내 제품, 음성비서
결합 서비스
– SKT NUGU, KT 기가지니
– 삼성 빅스비 등

나. 인공지능 음성인식 기술 전망

구분 기술 전망 설명
단기
전망
날씨, 주식 등
단순 대화
– AI 스피커 위주 초기 시장
– 스마트폰, hearable 기기
스마트 홈
서비스
– RNN 기술 단편적 적용
– 명령-수행 기반 서비스
장기
전망
자동 동시
통/번역
– AI 기술의 발전
– NLU, NLG 기반 문맥 인식
뇌파/영상
인식과 융합
– 종합 인식기술 발전
– BCI, 컴퓨터 비전 등 융합

– 국내 기업의 글로벌 경쟁력 위해 독자 S/W 플랫폼 개발, 한국어 적합 툴 연구/개발 필요

Categories: 디지털서비스
도리:

View Comments (2)