본문 바로가기

성동1기 전Z전능 데이터 분석가 과정

[전Z전능 DA] Day28 - SQL 5

 

eda (탐색적 데이터 분석)

데이터를 접할 때 부터 데이터를 잘 이해하고 파악한 다음 어떤 결과를 만들어 낼지

이 컬럼으로 필터링 해보고

 

그래서 우리는 eda를...

  1. 데이터의 테이블별 컬럼 , 로우별 이해
  2. 결측치 처리 및 데이터 필터링
  3. 시각화

 

eda 분석대상

1. 일변량 : eda를 통해 파악하려는 변수 1개

=> 데이터를 설명하고 패턴을 찾는 것이 목적

독립변수 하나에 종속 변수가 있는 것으로 일변량 분석은 어떤 대상의 성격을 규명하기 위하여

 

2. 다변량 : eda를 통해 파악하려는 변수 여러개

=> 변수들간의 관ㄱ계를 보는것이 목적

여러각도와 측면에서 변수들의 관계를 분석하는것에 유용

시각화 ㅈ

비시각화 주어진 둘 이상의 변수각 관계를 전체적으로 살펴보기

 

 

 

eda분석 종류

1.시각화 분석

차트 그림등을 이용하여 데이터 확인 => 데이터를 한 눈에 파악하여 대력적인 형태 파악 가능

 

2.비시각화 분석

그랙픽적 요소를 사용하지 않고 주로 요약 통계량으로 확인

=> 정확한 값을 파악하기 좋음

 

 

eda분석 유형

1.일변량 시각화 

연속형: 히스토그램 박스플랏 막대차트 (숫자)

범주형: bar 차트, 파이차트(문자)

 

2. 다변량 시각화

x범주형/ y연속형 :  바차트 / 집단간 통계 비교

x연속형/ y연속형 :  분산형 차트 (스캐터플랏)

x순서형/ y연속형 :  선차트/ 순서(시간)에 따른 연속값 추이 ex. 주식차트