지도 학습 (Supervised Learning)

I. 지도 학습의 개요

가. 지도 학습 (Supervised Learning)의 개념

나. 지도 학습의 특징

  • 명시적인 정답이 주어진 상황에서 기계를 학습 시키기 위해 데이터와 레이블을 사용
  • 사람이 목표값에 개입하므로 정확도가 높으나 시간이 오래걸리고 필요 데이터량이 많음

 

II. 지도 학습의 기법 및 알고리즘

가. 지도 학습의 기법

구분기법설명
분류이진 분류– 두 가지 중 하나로 분류하는 기법
e.g.) 고양이가 “맞다” or “아니다”로 분류
다중 분류– 여러 종류 중 하나로 분류하는 기법
e.g.) 동물 중 “고양이”로 분류
회귀독립변수
기반 분석
– 독립변수(입력값)의 개수에 따른 분석
– 단순/다중 회귀분석
종속변수
기반 분석
– 종속변수(독립변수에 의한 효과)의 개수에 따른 분석
– 일변량/다변량 회귀분석

나. 지도 학습을 이용한 알고리즘

구분알고리즘설명
인공신경망 측면CNN– 이미지 기반 특징 추출, 차원 축소를 통한 인식, 예측
– Convolution / Pooling Layer, Feature Map, Sub Sampling
RNN– 현재와 과거 데이터 고려 순차 데이터 처리 순환 신경망
– Input / Output / Hidden Layer, Time Unfolding, BPTT, LSTM
벡터 기반 측면SVM– 데이터를 두 클래스 분류 위해 Margin 최대 결정직선 탐색
– Support Vector, Margin, 초평면, 결정 직선, 커널 함수
회귀분석
(Regression)
– 변수 집합에서 독립/종속변수 간 상관관계를 함수로 표현
– 독립/종속 변수, 회귀 계수, 최소 자승법, 회귀 방정식

 

III. 지도 학습과 비지도 학습 비교

구분지도 학습비지도 학습
사용이유– 예측 모델 생성– 고차원 데이터 분류
성능평가– 교차 검증 수행– 검증 방법 없음
입력정보– Labeled Data– Raw Data
유형– 회귀: (x, y)로 f(x)=y파악
– 분류: 그룹별 특징 파악
– 군집: 데이터끼리 묶음
– 패턴인식: 여러그룹인식
알고리즘CNN, RNN, SVM, 의사결정 트리K-Means, DBSCAN, 군집(Clustering) 등
장점– 사람이 목표 값에 개입하여 정확도가 높음– 목표 값을 정해주지 않아도 되므로 속도 빠름
단점– 시간이 오래 걸리고 학습 데이터 양이 많음– 학습 결과로 분류 기준과 군집 예측 불가
사례– 패턴인식, 질병진단
– 주가 예측, 회귀 분석
– 스팸필터, 차원 축소
– 데이터마이닝, 지식발굴

 

[참고]

  • 위키 백과, “지도 학습 (Supervised Learning)”, 2018. 5
5 Comments

콘텐츠 사용 시 출처 표기 부탁 드리고, 댓글은 큰 힘이 됩니다^^