본문 바로가기

성동1기 전Z전능 데이터 분석가 과정

[전Z전능 DA] Day26 - SQL 3

 

🎯SQL 프로젝트

 

 

 

 

의사 결정자 이도운
프로젝트 매니저 김태연
기술 담당자 김동휘
연결 담당자 이한나
기록 담당자 박해오름

 

 

 

 

 

 

 

💡dbeaver 용량 부족할 때

 

참고 : https://rastalion.me/dbeaver%EC%97%90%EC%84%9C-java-heap-space-%EB%B6%80%EC%A1%B1%EC%9D%B4%EB%9D%BC%EA%B3%A0-%EB%82%98%EC%98%AC%EB%95%8C/

 

 

 

 

🌵eda 데이터 분석이란

  1. 로우데이터 이해 및 파악
  2. 어떤 결과를 만들어낼 지 데이터를 여러 측면으로 쪼개고 출력
  3. 인사이트를 얻어내는 것

 

🌵데이터 정합성 분석

 

• count 데이터 양 측정

 

 

  length 데이터 형태 측정

select char_length(rental_num), count(distinct rental_num)
from rental_list
group by 1
order by 1 desc

 

 

  distinct 데이터 중복 측정

SELECT COUNT(DISTINCT bike_id), COUNT(bike_id)
FROM Seongdong.TTR_trouble_list ttl;

 

 

  NULL 찾기

select count(use_time_min)
from rental_list
where use_time_min is null

 

 

  공백 ('') / N값 제거

select count(gender)	
from rental_list
where gender != ''  and  gender != 'N'

 

 

 


 

⚡SQL로 데이터 전처리를 하는데 파일 불러오기부터 난관이 많았다

DBEAVER로 파일을 가져올 때 한글로 된 필드명, 컬럼명을 영어로 바꾸고 (한글은 오류가 자주 나니까) 컬럼 타입도 VARCHAR(50)으로 통일해서 가져왔다. 나중에 숫자는 INT로 변경해주려고 했는데 안되서 우선 그대로 뒀다.

각 필드의 값들을 파악하고 빈값, NULL값 , N값이 있는지도 확인했다. 

 

프로그래머스 SQL 코테 문제풀기 

소형님과 스터디를 고민해보기