본문 바로가기

성동1기 전Z전능 데이터 분석가 과정

[전Z전능 DA]Day35 - PYTHON 기초6

🎯그래프 그리기

 

graph : 데이터를 보기 쉽게 그림으로 표현한 것

  • 추세와 경향성이 드러나 데이터의 특징을 쉽게 이해할 수 있다.
  • 새로운 패턴 발견, 데이터의 특징을 잘 전달
  • 다양한 그래프 
    • 2차원 그래프, 3차원 그래프
    • 지도 그래프
    • 네트워크 그래프
    • 모션 차트 
    • 인터랙티브 그래프

 

seaborn 패키지

  • 그래프를 만들 때 자주 사용되는 패키지
  • 코드가 쉽고 간결함

1. scatter plot 산점도

  • 데이터를 x축과 y축에 점으로 표현한 그래프
  • 나이와 소득처럼 연속값으로 된 두 변수의 관계를 표현할 때 사용

 

2.막대그래프 (bar chart)

  • 데이터의 ㄱ크기를 막대의 길이로 표현한 그래프
  • 성별 소득 차이처럼 집단 간 

3. 빈도 막대 그래프 sns.countplot 

 

 

4. 선그래프 (line chart) 데이터를 선으로 표현한 그래프

  • 시간에 따라 달라지는 데이터를 표현할 때 사용 (ex. 환율 , 주가지수등 경제지표가 시간에 따라 변하는 양상)
  • 시계열 데이터 (time serise data) : 일별 환율처럼 일정 시간 간격을 두고 나열된 데이터
  • 시계열 그래프 (time series chart) : 시계열 데이터를 선으로 표현한 그래프

5. 상자그림 (box plot) 데이터의 분포 또는 퍼져있는 형태를 직사각형 상자 모양으로 표현한 그래프

  • 데이터가 어떻게 분포하고 있는지 알 수 있다.
  • 평균값만 볼 때 보다 데이터의 특징을 더 자세히 이해할 수 있다 

 

 


 

 

현직자 특강 쏘카 주요한 매니저님

<데이터 분석 실습 엿보기 >

 

🌱데이터 마이닝이란

  • 데이터마이닝은 대량 데이터 세트의 처리 및 탐색을 위한 분석에 사용되는 방법
  • 데이터 마이닝 도구와 방법을 사용해 데이터에 숨겨진 패턴과 관계를 찾을 수 있습니다.
  • 데이터 마아닝은 원시 데이터를 실용적인 지식으로 변환합니다
  • 이 지식을 사용해 문제를 해결하고 비즈니스 의사 결정의 향후 영향을 분석하며 이윤을 증가시킵니다

 

 

 

 

🌱예측과 인과 추론

 

• 예시 1:  광고를 했더니 아이스크림 매출이 올랐따?  ➡️  전년대비 광고량을 늘린 2023년의 매출이 2022년에 비해 더 증가했다. 광고로 인해 아이스크림의 매출이 증가하는구나?  ➡️  광고량을 늘리면 매출이 늘어난다니.. 2024년에 대규모 광고를 집행하자!

광고떄문이 아니라 2023년 무더위가 지속 기간이 길어서 아이스크림 판매량이 늘어난 것이라면?? 광고를??????

 

• 예시2 : 미국 국방부의 위장탱크 분류 AI모델을 만들었따. 연구소에서는 정확도 100% 이고 국방부 시험에서는 50% 차이는 무엇일까?? 맑은날 위장탱크 사진, 흐린날 일반 탱크사진으로 분류하게 학습되어서 날씨가 피팅된 모델이었다. 

 

더보기

💡인과에 대한 고려 없는 예측은 불안정하고, 많은 비용을 야기할 수 있다. 

 

🌱