Olap과 다차원 모델
-
Upload
sungwook-kang -
Category
Documents
-
view
1.963 -
download
15
description
Transcript of Olap과 다차원 모델
강성욱 E-mail : [email protected]
Blog : http://sqlmvp.kr Datawaffle : http://datawaffle.com
OLAP 테크놀로지
OLAP과 다차원모델
차원(디멘전)과 차원항목
차원 • 큐브를 구성하는 축 • 사용자가 데이터를 분석하고자 하는 관점
차원항목(Member 또는 Element) • 각 축의 좌표
큐브(CUBE)와 셀(CELL)
셀(Cell) • 각 차원을 구성하는 항목들의 조합에 대한 데이터를 저장하는 논리적인 공간
• 3 x 2 x 3 = 18 cell
데이터 희박성(Sparsity)
희박성(Sparsity) • 셀은 논리적인 가상공간이며 물리적 존재 여부와는 별개 개념이다.
• 데이터가 존재하지 않는 셀은 물리적으로 존재하지 않게 된다. 이 부분이 희박성 이다.
계층구조
계층구조 • 데이터가 집계되는 기본적인 경로 페어런트(Parent) • 어떤 항목의 바로 상위 항목 차일드(Child) • 어떤 항목의 바로 하위 항목 씨블링(Sibling) • 동일한 페어런트를 가진 항목 루트항목(Root) • 페어런트를 갖지 않는 항목 리프항목(Leaf) • 차일드를 갖지 않는 항목 앤세스터(Ancestor) • 어떤 항목의 모든 상위 항목 디센던드(Descendent) • 어떤 항목의 모든 하위 항목
대칭 구조 레벨
레벨4, 제네레이션1
레벨3, 제네레이션2
레벨2, 제네레이션3
레벨1, 제네레이션4
비대칭 구조 레벨
애트리뷰트 / 관계식
애트리뷰트(Attribute)
• 차원 항목들의 특성을 나타내는 텍스트 형태의 정보 Ex) • 매장 : 매장 주소, 전화번호, 담당자, 매장크기, 직영 여부, 개점일 등 • 제품 : 제품의 색상, 크기, 신제품 여부 등 관계식 • 항목들간의 관계를 식으로 정의 Ex) • 평균 매출 가격 : 매출액 / 매출 수량 • 세금 : 매출액 * 0.2
스타스키마
• 하나의 팩트 테이블과 다수의 디멘젼
테이블로 구성
• 팩트(사실) : 분석하고자 하는 대상 항
목
• 디멘젼(차원) : 사실을 보는 관점
다차원 데이터를 효과적으로 저장, 조회하기 위한 관계형DB의 설계 기법
E-R모델과 스타스키마
E-R 모델
• 갱신 성능을 최적화
• 정규화됨
• OLTP
• 다수의 테이블로 구성
• 소수의 열
• 테이블간 여러 조인 경로
스타스키마
• 최적의 질의 응답을 위한 설계 기법
• 비정규화 됨
• OLAP
• 소수의 테이블로 구성
• 다수의 컬럼
사실테이블 / 차원테이블
점진적으로 진화하는 차원에 대한 대처(SCD) • 차원 항목들의 애트리뷰트가 시간이 흐름에 따라 변화 • Ralph Kimball 정의
새로운 값으로 덮어 쓰기
• 구현이 쉬움
• 변경 과정을 파악 할 수 없음
• 과거 데이터가 중요하지 않은 경우 사용
사실테이블 / 차원테이블
새로운 레코드 추가
• 변경 시점에 새로운 속성값을 가지는 레코드 추가
• 써로게이트키(대체키) 이용
• 일반적으로 많이 선호 함
사실테이블 / 차원테이블
새로운 필드 추가
• 시작 속성과 현재 속성, 변경일 기준으로 관리
• 스키마 변경으로 인한 관리 어려움.
스노우플레이크 스키마
• 스타스키마의 팩트 테이블 구조와 동일하게 유지하면서 차원 테
이블은 정규화된 구조를 형성
• 팩트 테이블과 조인되는 차원 테이블이 있으며 이 차원 테이블은
또 다른 테이블의 기본키를 참조하는 외래키를 가짐
스노우플레이크 스키마
• 스키마 확장에 용이
• 많은 데이터 보유로 인한 성능과 집계 영향
• 참조되는 데이터를 Outboard 또는 OutBridge 불림
변수 차원
변수차원
• 자산. 부채, 수익, 비용등과 같이 비즈니스 성과를 측정하기 위한 항목
특성
• 다른 차원들의 존재 기반을 제공
• 나머지 차원들의 상세 정도를 결정
하이퍼 큐브
블록 멀티 큐브
시리즈 멀티 큐브
참고자료
• OLAP 테크놀로지 (시그마)