eda (탐색적 데이터 분석)
데이터를 접할 때 부터 데이터를 잘 이해하고 파악한 다음 어떤 결과를 만들어 낼지
이 컬럼으로 필터링 해보고
그래서 우리는 eda를...
- 데이터의 테이블별 컬럼 , 로우별 이해
- 결측치 처리 및 데이터 필터링
- 시각화
eda 분석대상
1. 일변량 : eda를 통해 파악하려는 변수 1개
=> 데이터를 설명하고 패턴을 찾는 것이 목적
독립변수 하나에 종속 변수가 있는 것으로 일변량 분석은 어떤 대상의 성격을 규명하기 위하여
2. 다변량 : eda를 통해 파악하려는 변수 여러개
=> 변수들간의 관ㄱ계를 보는것이 목적
여러각도와 측면에서 변수들의 관계를 분석하는것에 유용
시각화 ㅈ
비시각화 주어진 둘 이상의 변수각 관계를 전체적으로 살펴보기
eda분석 종류
1.시각화 분석
차트 그림등을 이용하여 데이터 확인 => 데이터를 한 눈에 파악하여 대력적인 형태 파악 가능
2.비시각화 분석
그랙픽적 요소를 사용하지 않고 주로 요약 통계량으로 확인
=> 정확한 값을 파악하기 좋음
eda분석 유형
1.일변량 시각화
연속형: 히스토그램 박스플랏 막대차트 (숫자)
범주형: bar 차트, 파이차트(문자)
2. 다변량 시각화
x범주형/ y연속형 : 바차트 / 집단간 통계 비교
x연속형/ y연속형 : 분산형 차트 (스캐터플랏)
x순서형/ y연속형 : 선차트/ 순서(시간)에 따른 연속값 추이 ex. 주식차트
'성동1기 전Z전능 데이터 분석가 과정' 카테고리의 다른 글
[전Z전능 DA] Day30 - PYTHON 기초 1 (1) | 2023.11.24 |
---|---|
[전Z전능 DA] Day29 - SQL 프로젝트 발표 (0) | 2023.11.23 |
[전Z전능 DA] Day27 - SQL 4 (1) | 2023.11.22 |
[전Z전능 DA] Day26 - SQL 3 (1) | 2023.11.20 |
[전Z전능 DA] Day25 - SQL 2 (0) | 2023.11.17 |