728x90

Data & BI 36

[LeetCode](중급) 178. Lank Score (MS SQL)

문제Column NameTypeidintscoredecimalid is the primary key (column with unique values) for this table.Each row of this table contains the score of a game. Score is a floating point value with two decimal places. score 별 rank 를 매기고 각 score 별 순위를 score 별 내림차순으로 출력해라. 풀이SELECT A.score, R.idx as rank FROM Scores ALEFT OUTER JOIN (SELECT score, ROW_NUMBER() OVER (ORDER BY score DESC) AS idx FROM Scores ..

[LeetCode](중급) 176. Second Highest Salary

문제Column NameTypeidintsalaryint[Table : Employee]id is the primary key (column with unique values) for this table.Each row of this table contains information about the salary of an employee. Write a solution to find the second highest distinct salary from the Employee table. If there is no second highest salary, return null 주어진 Employee 테이블에서 두 번째로 높은 급여를 조회해라. 두 번째 급여가 없다면 null을 조회해라. 풀이SELECT..

[LeetCode](초급) 182. Duplicate Emails

문제Column NameTypeidintemailvarchar[Table : Person]id is the primary key (column with unique values) for this table.Each row of this table contains an email. The emails will not contain uppercase letters. Write a solution to report all the duplicate emails. Note that it's guaranteed that the email field is not NULL.주어진 테이블에서 중복된 이메일을 출력해라. 풀이SELECT DISTINCT(ABC.email)FROM (SELECT email, COUNT..

2. Azure Databricks - 카탈로그(Catalog)

이전 시간에는 클러스터를 만드는 방법에 대해 실습했다. 이번에 공부해볼 메뉴는 "카탈로그"이다. 카탈로그(Catalog) 란? 공식문서를 찾아보니 Unity 카탈로그라고 칭하는 것 같다. 너무 길어 카탈로그라고 하겠다. 카탈로그는 Azure Databricks 작업영역에서 중앙 집중식 액세스 제어, 감사, 계보 및 데이터 검색 기능을 제공한다. 쉽게 말하자면 여러 작업영역을 하나의 카탈로그로 제어한다고 생각하면 될 것 같다. * 주요기능모든 작업영역의 데이터 액세스 정책 관리 가능보안 모델(ANSI SQL) 기반으로, 관리자는 카탈로그, 스키마(DB) 등을 기존 Data lake에서 권한 부여 가능데이터에 엑세스하는 사용자 로그 기록데이터 자산에 태그 지정 및 문서화 가능, 검색 인터페이스 제공데이터 엑..

1. Azure Databricks 컴퓨팅 - Cluster 만들기

Databricks가 무엇인지에 대한 설명은 여러 곳에서 찾을 수 있기 때문에 생략합니다. 해당 포스팅은 직접 실습을 하며 궁금한 점을 정리하는 목적으로 작성했습니다. [1] 작업환경 Databricks Workspace는 Azure 내 리소스에서 지원되는 Azure Databricks Service 를 사용했습니다. 해당 화면은 Databricks Workspace 초기화면입니다. 실습을 시작하기에 앞서 왼편에 많은 기능들이 수록되어 있는 것을 볼 수 있습니다. 이 중 제가 주로 실습해볼 기능은 다음과 같습니다.카탈로그컴퓨팅SQL 편집기SQL Warehouse데이터 수 [2] 기능설명컴퓨팅컴퓨팅 메뉴는 '클러스터'를 생성하는 공간입니다. 그렇다면 '클러스터'는 무엇일까요?※클러스터 : 여러 대의 가상 ..

Power BI Desktop 에서 ODBC (Postgresql DB) 연결하기.

[ 사전 설치 필요 ]나의 컴퓨터 사양 : Windows 10 Pro, 64bit, 32RAMPower BI Desktop Version : 2.142.928.0 64-bit (2025년 4월)Postgre ODBC Driver [ 실행 ]Power BI Desktop 에서 ODBC 커넥터를 사용하여 PostgreSQL DB에 접근하려면 DSN을 추가하여야 한다.현재, 따로 DSN 을 추가한 이력이 없기 때문에 기본 리스트만 보인다. DSN을 추가하기 위해서 "ODBC 데이터 원본 관리자" 를 실행한다. ODBC 데이터 원본 관리자 - 사용자 DSN - 추가 - 새 데이터 원본 만들기현재 Postgre ODBC Driver 를 설치하지 않아 Postgre 드라이버가 나타나지 않는다.드라이버 설치는 htt..

Data & BI/Power BI 2025.05.07

[DW&BI] 제 2장 : 다차원 모델링 기법(Dimension&Fact)

다차원 모델링을 시작하기 전, 설계를 맡은 개발자는 비즈니스 요구사항과 원천 데이터를 이해해야 한다. 현업 담당자와 회의를 통해 핵심성과지표(KPI), 비즈니스 이슈, 의사결정 프로세스, 분석 요건을 들을 수 있고 이에 대한 비즈니스 목표를 이해할 수 있다. 다차원 모델링을 시작할 때, 다차원 모델은 현업 담당자가 참여하여 설계하여야 한다. 모델링은 1차적으로 데이터 모델러의 책임이지만, 현업 담당자들과 긴밀한 협업을 통해 진행되어야 한다. 다차원 모델링에서 네 가지 핵심 의사결정은 다음과 같다. # 4단계 다차원 설계 프로세스 비즈니스 프로세스를 선택한다. 그레인을 확정한다. 디멘션을 식별한다. 팩트를 식별한다. 팩트까지 확정이 된다면, 그 후에는 테이블의 컬럼명, 등의 규칙을 결정하게 된다. 이번 게..

Data & BI/Database 2022.07.02
728x90