다차원 모델링 (Star, Snowflake Schema)

I. DW 모델링, 다차원 모델링

DW 모델링 시 사실 테이블과 차원 테이블 간 상호관계를 정의하여 다차원으로 구현하는 모델링 기법

 

II. 다차원 모델링의 구성요소

구분구성요소
사실
(Facts)
중심테이블로서 관련성이 높은 매체 집합
두 가지 Type의 Measure
 – Raw(Base) fact / Derived(Calculated) metric
차원
(Dimensions)
부속 테이블(minor 테이블)
각 Fact를 분석하는 하나의 관점
속성
(Attribute)
각 차원 테이블이 가지고 있는 속성임
사실을 검색하고, 여과하고 분류할 때 사용됨
속성계층
(Hierarchies)
차원 내 정의된 속성들 간 존재 계층 관계
아래로 가기(Drill-down)/위로 가기(Roll-up)

 

III. 다차원 모델링 기법

가. Star Schema 모델링

구성도설명
– 하나의 사실 테이블
– 다수의 차원 테이블
– 적은 Join, 빠른 Query 성능
(+) 쉬운 이해, 계층 정의 용이
(-) 상위레벨 조회 성능 저하

나. Snowflake Schema

구성도설명
– 차원 테이블을 정규화
– 데이터 중복 문제 해결
– Star Join으로 속도 저하 가능
(+) 데이터 중복 해결, 정규화
(-) Star Join으로 속도 저하

 

IV. 다차원 모델 기법 간 비교

항목Star SchemaSnowflake Schema
정규화– 비정규화– Dimension Table 정규
정합성– 보장 불가– 정합성 보장
Join정도– 적은 Join 성능, 빠름– Join 횟수 증가, 느림
특징– 다차원 분석– 계층화 및 분석 가능
장점– 조인 수 적임, 고성능– 소형 테이블, 정규화
단점– Data 일관성 낮음– 조인수 많음, 저성능

 

콘텐츠 사용 시 출처 표기 부탁 드리고, 댓글은 큰 힘이 됩니다^^