본문 바로가기

성동1기 전Z전능 데이터 분석가 과정

[전Z전능 DA] Day25 - SQL 2

COALESCE(val1, val2, ... )

안의 인자들 중에서 첫번째로 온 NULL값을 반환해 주는 함수

 

RANK() OVER,   DENSE_RANK() OVER 

RANK() over (order by column desc) RANK   : 별칭이 꼭 들어간다

PARTITION BY  : RANK() OVER 일때 사용하는 GROUP BY 

 

 

JOIN

INNER JOIN 

LEFT JOIN 

RIGHT JOIN

FULL OUTER JION

 

 

SUB QUERY 

한 쿼리 안에 SELECT문이 또 있다?

하나의 SQL문 안에 포함되어 있는 또 다른 SQL문

SELECT, FROM , WHERE 절에서 사용할 수 있습니다.

 

• SELECT 에서의 SUB QUERY

하나의 열(COLUMN)처럼 사용한다, 별칭을 꼭 적어준다,

(성능 문제로 SELECT절에서는 잘 사용하지않는다) , JOIN을 더 많이 사용한다

 

  FROM 에서의 SUB QUERY

하나의 테이블처럼 사용 , 별칭을 꼭 적어준다

내가 만든 테이블, 한번 연산을 마친 테이블처럼 사용한다

 

  WHERE 에서의 SUB QUERY

IN을 사용하여 조건으로 사용

 

WHERE절에서 집계함수, 별칭 사용 못한다 (HAVING으로 연산 사용)

 

 

CREAT VIEW

가상의 테이블(실제로 데이터를 저장하고 있지는 않음)

CREATE VIEW ~ AS 

SELECT ~~~

이런저런 조건을 걸어서 뽑아온 (전처리해놓은) 데이터를 저장해놓고 불러와 보고싶다 ( 실제 저장하는 행동은 추천하지 않음) 할때 CREATE VIEW로 

 

 

SQL프로젝트 (따릉이)

데이터를 어떻게 다루고 클렌징하고 분석하는지 가이드 주신다

문제정의는 팀별로 논의 

 

 

 

EDA

  데이터 정합성 분석

1. COUNT 데이터 양 측정

2. LEN 데이터 형태 측정

3. DISTINCT 데이터 중복 측정

 

  EDA 데이터 분석이란?

로우데이터 이해 및 파악 => 어떤 결과를 만들어낼지 데이터를 여러 측면으로 쪼개고 출력 => 인사이트를 얻어내는 것

 

1.데이터 컬럼들과 로우의 의미 이해

2.결측치 처리 및 데이터 클렌징

3.시각화 (SQL 데이터뽑아서 구글시트로 시각화)

 

  주의해야할 점 

무의식적 판단, 인지적 편향X  => 정보(데이터)만 객관적으로 바라보자, 데이터에 기반하여 분석해본다