OLAP (On-Line Analytical Processing)

I. 데이터 기반 의사결정 지원, OLAP

  • 최종사용자가 직접 다차원으로 이루어진 데이터로부터 통계적인 요약 정보 분석 기반 의사결정 활용 기술
     

II. OLAP의 유형

가. OLAP의 유형 구조

  • OLAP은 선 계산된 값 저장 방식에 따라 다차원DB는 MOLAP, 관계형DB는 ROLAP, 데스크탑은 DOLAP, 선택 시 HOLAP으로 구분

나. OLAP의 유형

유형저장 방식설명
MOLAP– 다차원 DB 기반– 다차원 데이터 저장, 프로세싱 MDB사용, 데이터이동 최소화
ROLAP– RDBMS 기반– 관계형 DB기반 OLAP
– 관계형 Data-Client 간 엔진
DOLAP– 클라이언트 처리– 클라이언트에서 모든 처리수행
– 대용량 데이터 처리 한계
HOLAP– 다차원, RDB 병행– MOLAP/ROLAP의 하이브리드
– 신규데이터는 다차원DB, 상세 데이터는 RDBMS에 저장
  • OLAP은 OLTP에서 발생한 원시 데이터가 저장된 DW의 데이터 소스 기반 정보 분석

 

III. MOLAP과 ROLAP 비교

항목MOLAPROLAP
특성-다차원 모델링/질의– 다차원 질의 도구
데이터 조작– Read / Write– Read 중심
데이터 요구량– 대용량– 초대용량
연산 기능– 다양한 연산– 제한된 연산
개발 주체– 최종 사용자 주도– 전산부서 주도

[참고] OLTP에서 OLAP까지의 과정


OLTP에서DW, DM, OLAP에 이르기까지의 과정에서 중간 중간에서 데이터를 이관하는 과정을 ETL이라고 합니다. E(Extraction – 추출), T(Transformation – 변형), L(Load – 적재)의 3가지 과정을 거치게 됩니다. ETL은 또는 ETT라고 합니다. 마지막에 T는 Transportation(수송) 입니다.
 
다음 그림과 같이 도식화할 수 있습니다. 중간에 변형작업에서 주로 하는 일은 바로 정제 입니다. OLTP에서 발생한 데이터를 그대로 이관하여 DW, DM을 만들게 될 때 가장 먼저 부딪히는 벽이 바로 데이터의 정합성 문제 입니다. 이를 해결하기 위해서 DQ(Data Quality)를 하게 되는데 다음에 알아 보도록 하겠습니다.
 
OLTP에서 DW로 바로 데이터를 넣기 전에 임시 영역이 있습니다. 이를 영어로 Staging 영역이라고 하며, 데이터베이스나 파일 시스템 기반의 물리적 저장소로서 각 영역 간의 데이터 이전/통합/가공을 원활히 하고 안정적으로 수행하기 위해 임시적으로 사용하는 영역이라고 할 수 있습니다.
 
DW에서 ODS(Operational data store)라고 하는 운영 데이터 영역은 분리된 각각의 원천 시스템으로부터 운영 데이터를 통합한 저장소를 말합니다. ODS에는 트랜잭션 레벨의 상세한 데이터가 전사적인 데이터 수요를 만족하는 일반적이고 통합된 데이터를 저장하고 있어 전사적인 정보가 트랜잭션 레벨의 상세한 형태로 중복이 제거되어 통합 저장되기 때문에, 운영 리포트를 제공할 수 있는 소스가 될 뿐 아니라 하나의 업무가 아닌 여러 업무에 걸친 현재 시점의 데이터를 통한 리포트 제공에도 활용됩니다. 이 영역은 때로는 고객이나 상품과 같은 핵심 주제 영역의 데이터 추출 용도의 마스터 데이터 관리 허브로 사용되기도 합니다.
 
이렇게 용어에 대해서 알아보았습니다. OLTP에서ODS, DW, DM, OLAP까지 한번에 오류 없이 데이터를 전송하기란 쉬운 일은 아닙니다. OLTP를 위한 시스템의 개발과는 달리 BI의 구축은 특히Data 에 관한 구체적인 지식이 요구되므로 데이터를 찾고, 품질을 높이고 데이터를 정련하는데 많은 시간이 소요됩니다. OLTP운영에서는 이상이 없지만, BI구축의 데이터 정합성 문제는 가장 큰 이슈입니다. 또 BI 개발이 끝났다 하더라도 OLTP에서 DB정보를 변경하는 일(컬럼 추가/삭제, 테이블 추가/삭제)은 비일비재합니다. 가장 안 좋은 케이스는 OLTP에서 제대로 된 ER-Diagram조차 없었을 때 입니다. 시스템의 분석을 위해 필요한 산출물이 없는 경우Reverse Engineering을 하기도 합니다. OLAP구축 전 단계인 DM까지 데이터를 이관하고 정합성을 체크하는데, 전체 개발기간의60% 이상이 할애되기도 합니다.
[출처] http://www.sqler.com/498994

 

콘텐츠 사용 시 출처 표기 부탁 드리고, 궁금한 점이나 의견은 댓글 남겨주세요^^