🎯SQL 프로젝트
의사 결정자 | 이도운 |
프로젝트 매니저 | 김태연 |
기술 담당자 | 김동휘 |
연결 담당자 | 이한나 |
기록 담당자 | 박해오름 |
💡dbeaver 용량 부족할 때
🌵eda 데이터 분석이란
- 로우데이터 이해 및 파악
- 어떤 결과를 만들어낼 지 데이터를 여러 측면으로 쪼개고 출력
- 인사이트를 얻어내는 것
🌵데이터 정합성 분석
• count 데이터 양 측정
• length 데이터 형태 측정
select char_length(rental_num), count(distinct rental_num)
from rental_list
group by 1
order by 1 desc
• distinct 데이터 중복 측정
SELECT COUNT(DISTINCT bike_id), COUNT(bike_id)
FROM Seongdong.TTR_trouble_list ttl;
• NULL 찾기
select count(use_time_min)
from rental_list
where use_time_min is null
• 공백 ('') / N값 제거
select count(gender)
from rental_list
where gender != '' and gender != 'N'
⚡SQL로 데이터 전처리를 하는데 파일 불러오기부터 난관이 많았다
DBEAVER로 파일을 가져올 때 한글로 된 필드명, 컬럼명을 영어로 바꾸고 (한글은 오류가 자주 나니까) 컬럼 타입도 VARCHAR(50)으로 통일해서 가져왔다. 나중에 숫자는 INT로 변경해주려고 했는데 안되서 우선 그대로 뒀다.
각 필드의 값들을 파악하고 빈값, NULL값 , N값이 있는지도 확인했다.
프로그래머스 SQL 코테 문제풀기
소형님과 스터디를 고민해보기
'성동1기 전Z전능 데이터 분석가 과정' 카테고리의 다른 글
[전Z전능 DA] Day28 - SQL 5 (0) | 2023.11.22 |
---|---|
[전Z전능 DA] Day27 - SQL 4 (1) | 2023.11.22 |
[전Z전능 DA] Day25 - SQL 2 (0) | 2023.11.17 |
[전Z전능 DA] Day24 - SQL 1 (0) | 2023.11.16 |
[전Z전능 DA] Day23 - SQL , Chat GPT (0) | 2023.11.16 |