728x90

DW&BI 4

[DW&BI] 제 2장 : 다차원 모델링 기법(Dimension&Fact)

다차원 모델링을 시작하기 전, 설계를 맡은 개발자는 비즈니스 요구사항과 원천 데이터를 이해해야 한다. 현업 담당자와 회의를 통해 핵심성과지표(KPI), 비즈니스 이슈, 의사결정 프로세스, 분석 요건을 들을 수 있고 이에 대한 비즈니스 목표를 이해할 수 있다. 다차원 모델링을 시작할 때, 다차원 모델은 현업 담당자가 참여하여 설계하여야 한다. 모델링은 1차적으로 데이터 모델러의 책임이지만, 현업 담당자들과 긴밀한 협업을 통해 진행되어야 한다. 다차원 모델링에서 네 가지 핵심 의사결정은 다음과 같다. # 4단계 다차원 설계 프로세스 비즈니스 프로세스를 선택한다. 그레인을 확정한다. 디멘션을 식별한다. 팩트를 식별한다. 팩트까지 확정이 된다면, 그 후에는 테이블의 컬럼명, 등의 규칙을 결정하게 된다. 이번 게..

DW&BI 2022.07.02

[DW&BI] 제 1장 : DW/BI 아키텍처(Architecture)

제 1장 : DW/BI Architecture DW/BI 환경에서 고려해야 할 개별 구성 요소에는 크게 4가지가 있다. 운영계 원천 시스템 ETL 시스템 프레젠테이션 영역 BI 애플리케이션 이 4가지에 대해 간단히 요약하여 알아보자. # 운영계 원천 시스템 원천 시스템의 중요한 우선순위는 처리 성능과 가용성이다. 원천 시스템에 대한 운영 쿼리들은 정상적인 트랜잭션 흐름에서 1회 1레코드 쿼리이며, 운영 시스템에서 엄격히 제한된다. 원천 시스템에서는 DW/BI 시스템에서처럼 광범위하고 예상치 못한 방법으로 쿼리를 하지 않는다고 생각하는 것이 옳다. # ETL 시스템 DW/BI 환경에서 추출, 변환, 적재 시스템은 작업 영역, 데이터 구조, 프로세스 집합으로 구성된다. ETL 시스템은 운영계 원천 시스템과 ..

DW&BI 2022.06.20

[DW&BI] 제 0장 : Data Warehouse(DW) & Business Intelligence(BI)

[DW&BI] 카테고리의 게시물을 시작하기에 앞서, 이 게시물은 참고 도서 (The Warehouse Toolkit - 3rd Edition) 을 읽으며 정리한 게시물임을 밝힌다. 또한, 모든 내용을 정리하는 것이 아닌 점을 참고 바란다. 제 0장 : Data Warehouse & Business Intelligence 현재, 나는 다수 기업의 현장개발에 참여하며 BI 개발에 힘쓰고 있다. Power BI 툴을 이용해 Dashboard 개발 중이며, BI 를 하다보니 개발 앞단에서 필요한 DW 구축에 욕심이 생겨 공부를 시작하게 되었다. 본 도서에서는 DW/BI 의 목표를 이렇게 말하고 있다. 비즈니스 사용자도 쉽게 데이터에 접근할 수 있어야 한다. 단지 나에게 중요한 것만 보여줘라. 이렇듯이, DW/B..

DW&BI 2022.06.19

[Database] 정규화(Normalization)란?

Database 분야를 공부한다면 빠질 수 없는 개념이 바로 "정규화(Normalization)" 이다. 어디서 읽었고 공부한 경험이 있을 수 있지만 실전으로 많이 부딛히지 않았다면 헷갈리는 것이 바로 정규화일 것 같다. (물론 나만 일 수도 있지만...) 아무튼 나는 헷갈리니 이 게시물을 통해 정리하면서 한번 더 복습해보고자 한다. # 정규화(Normalization) 쉽게 말하여 "테이블 간의 중복된 데이터를 허용하지 않는다" 라는 성격을 띄고 있다. 무결성을 유지한다. 정규화의 단계를 알아보자. [ 제1 정규화 ] 제1 정규화는 테이블의 컬럼이 원자값(Atomic Value : 하나의 값)을 가지도록 하는 것이다. 예를 들어, 실무에서 다음과 같은 엑셀 데이터를 받는다고 생각해보자. 실제로 나는 이..

DW&BI 2022.06.19
728x90