🎯그래프 그리기
graph : 데이터를 보기 쉽게 그림으로 표현한 것
- 추세와 경향성이 드러나 데이터의 특징을 쉽게 이해할 수 있다.
- 새로운 패턴 발견, 데이터의 특징을 잘 전달
- 다양한 그래프
- 2차원 그래프, 3차원 그래프
- 지도 그래프
- 네트워크 그래프
- 모션 차트
- 인터랙티브 그래프
seaborn 패키지
- 그래프를 만들 때 자주 사용되는 패키지
- 코드가 쉽고 간결함
1. scatter plot 산점도
- 데이터를 x축과 y축에 점으로 표현한 그래프
- 나이와 소득처럼 연속값으로 된 두 변수의 관계를 표현할 때 사용
2.막대그래프 (bar chart)
- 데이터의 ㄱ크기를 막대의 길이로 표현한 그래프
- 성별 소득 차이처럼 집단 간
3. 빈도 막대 그래프 sns.countplot
4. 선그래프 (line chart) 데이터를 선으로 표현한 그래프
- 시간에 따라 달라지는 데이터를 표현할 때 사용 (ex. 환율 , 주가지수등 경제지표가 시간에 따라 변하는 양상)
- 시계열 데이터 (time serise data) : 일별 환율처럼 일정 시간 간격을 두고 나열된 데이터
- 시계열 그래프 (time series chart) : 시계열 데이터를 선으로 표현한 그래프
5. 상자그림 (box plot) 데이터의 분포 또는 퍼져있는 형태를 직사각형 상자 모양으로 표현한 그래프
- 데이터가 어떻게 분포하고 있는지 알 수 있다.
- 평균값만 볼 때 보다 데이터의 특징을 더 자세히 이해할 수 있다
현직자 특강 쏘카 주요한 매니저님
<데이터 분석 실습 엿보기 >
🌱데이터 마이닝이란
- 데이터마이닝은 대량 데이터 세트의 처리 및 탐색을 위한 분석에 사용되는 방법
- 데이터 마이닝 도구와 방법을 사용해 데이터에 숨겨진 패턴과 관계를 찾을 수 있습니다.
- 데이터 마아닝은 원시 데이터를 실용적인 지식으로 변환합니다
- 이 지식을 사용해 문제를 해결하고 비즈니스 의사 결정의 향후 영향을 분석하며 이윤을 증가시킵니다
🌱예측과 인과 추론
• 예시 1: 광고를 했더니 아이스크림 매출이 올랐따? ➡️ 전년대비 광고량을 늘린 2023년의 매출이 2022년에 비해 더 증가했다. 광고로 인해 아이스크림의 매출이 증가하는구나? ➡️ 광고량을 늘리면 매출이 늘어난다니.. 2024년에 대규모 광고를 집행하자!
광고떄문이 아니라 2023년 무더위가 지속 기간이 길어서 아이스크림 판매량이 늘어난 것이라면?? 광고를??????
• 예시2 : 미국 국방부의 위장탱크 분류 AI모델을 만들었따. 연구소에서는 정확도 100% 이고 국방부 시험에서는 50% 차이는 무엇일까?? 맑은날 위장탱크 사진, 흐린날 일반 탱크사진으로 분류하게 학습되어서 날씨가 피팅된 모델이었다.
더보기
💡인과에 대한 고려 없는 예측은 불안정하고, 많은 비용을 야기할 수 있다.
🌱
'성동1기 전Z전능 데이터 분석가 과정' 카테고리의 다른 글
[전Z전능 DA]Day37 - PYTHON 프로젝트 2 (1) | 2023.12.05 |
---|---|
[전Z전능 DA]Day36 - PYTHON 프로젝트 1 (0) | 2023.12.04 |
[전Z전능 DA]Day34 - PYTHON 기초5 (0) | 2023.11.30 |
[전Z전능 DA]Day33 - PYTHON 기초4 (0) | 2023.11.29 |
[전Z전능 DA] Day32 - PYTHON 기초3 (1) | 2023.11.28 |