X

데이터 웨어하우스 (DW, Data Warehouse)

I. 다차원 데이터 분석 자료 제공, DW

가. DW(Data Warehouse)의 개념

  • 관계형 DB 기반 대단위 데이터를 분석하여 의사결정에 도움을 주는 저장소 및 시스템

나. DW의 특징

특징 설명
주제 중심적 – 분석하려는 주제 중심 시스템 구조화
– 고객, 거래처, 상품 등 주제 중심 구현
비휘발성 – DW 기록 후 변경되지 않으며 분석 일관성
– 대규모 데이터 로딩하여 읽기 전용
통합적 – 기존 데이터 추출하여 원하는 형태로 변형
– 다른 방식의 데이터를 일관된 방식 표현
시간 가변적 – 일정 기간 정확성 유지, 시점 별 요소 반영
– 시점 별 분석 가능 (주가정보, 환율정보)
  • DW는 소스데이터로부터 자료를 이관하는 ETT/ETL과 ODS, Metadata 등으로 구성

 

II. DW의 구성도 및 구성요소

가. DW의 구성도

나. DW의 구성요소

역할 구성요소 설명
데이터
추출
ETT/ETL – Extract Transform Transportation(Load)
– 데이터를 소스에서 추출, DW에 로드
ODS – Operational Data Store (운영 정보 저장소)
– 실시간성 데이터를 바로 DW 저장
데이터
저장
Metadata – DW 저장 데이터의 정보 저장
– 데이터 사용성, 관리 효율성 추구
Data Mart – 특화된 소규모 DW(부서별, 분야별)
– 특정 비즈니스 프로세스
데이터
분석
OLAP – 최종 사용자의 대화식 정보분석도구
– 다차원 정보 직접 접근
Data Mining – 데이터상 의미 있는 패턴 검색 과정
– 미래예측 위한 의미있는 정보 추출

 

III. DW 구축 단계 및 구축 방법

가. DW 구축 단계

단계 프로세스 설명
1단계 DW Modeling – 비즈니스 영역 선정, 분석
– DW/ODS Modeling
2단계 ETL(Legacy → DW) – 운영계에서 수집된 Data를
ODS와 DW로 정제, 변환, 적재
3단계 Data Mart Modeling – 다차원 분석 영역 정의
– Data Mart 모델링
4단계 ETL(ODS/DW → Data Mart) – ODS/DW로부터 데이터 추출
– 다차원 DB 구성
5단계 ROLAP 구축 – DW에서 ROLAP 개발
6단계 MOLAP 구축 – Data Mart에서 MOLAP 개발
7단계 DW 시스템 운영 – ETT Scheduling, 메타데이터 관리
– Backup & Recovery 수행

나. DW 구축 방법

구분 설명
Top-Down – 전사 관점에서 전체 DW를 한 번에 구축
– 시간/비용 많이 소요되며 전사적 지원 필요
Bottom-up – 특정 그룹 별 Data Mart 구축 후 DW통합
– 향후 통합에 대한 설계 고려 필요
Hybrid – DW와 Data Mart 병행 구축
– 비용, 인력 분산 투입 가능, 위험 최소화

 

IV. DW 구축 핵심 성공요인 및 구축 시 고려사항

가. DW 구축 핵심 성공요인

핵심 성공요인 설명
조직 측면 – 경영 전략에 정렬, 지속적 개선
– 경영자의 의지, 관리체계 수립
기술 측면 – Data 품질 보장, ETT 성능 확보
– 지속적 튜닝
사용자 측면 – 사용자 중심 구축
– Real Time DW 추구

나. DW 구축 시 고려사항

구분 고려사항
개발 측면 – 의사소통 체계 마련, 성능 저하 가능성 고려
운영 측면 – 지속적 관리, 기존 시스템과 통합 연계
  • 빅데이터, 데이터 스트리밍 등 대량의 정형/비정형 데이터를 저장, 보관 시 데이터 레이크 적용

 

Categories: 데이터베이스
도리:

View Comments (1)

  • 안녕하세요! 좋은글 감사합니다. DW 구축 방법에 관해 궁금한 것이 있는데요, 구축 비용은 보통 Top-down > Bottom-up > Hybird 순으로 많이 드나요? 그리고 어떤 방법이 가장 많이 쓰이나요??