본문 바로가기

성동1기 전Z전능 데이터 분석가 과정

[전Z전능 DA] Day1 - OT/ 데이터 분석을 위한 핵심 개념

데이터란

컴퓨터에서 처리하는 문자, 숫자, 소리 그림 형태로 된 자료

  • 생활기록부, 범죄이력, 신용정보, 졸업증명
  • 실험적 절차를 거치거나 표준화된 검사를 통해 얻어진 사실
  • 설문조사, 여론조사 결과

 

데이터는 기본적으로 통계학 이론을 근간으로 사용되는 경우가 절대다수

  • 기술통계 : 모수에 관계없이 데이터가 가진 통계적 의미를 찾는 것 (산술평균,표준편차,표본...)
  • 추론통계 : 데이터 표본을 가지고 모집단의 특성을 수정하는 것 (가설과 검증을 위한 실험)
  • 데이터 마이닝 :  데이터가 가진 패턴/특징을 찾아내는 것 ( 회귀분석과 같은 수학 알고리즘 => ML/DL => AI...)

 

데이터 분석 프로세스

 

데이터 직군별 비교

data engineer (=개발자)

data analyst (=비즈니스 문제해결, 기획)

data scientist / ML engineer (위 2가지 역량이 모두 있는 사람)

 

고객데이터를 분석해야 하는 이유

회사 내 데이터 종류

-서비스데이터

-사용자 행동 데이터(런칭 이후 시작)

 

사용자 행동 데이터 분석 주제

-사용자들이 기능을 어떤 순서로 사용하는가

-어느 기능과 특정 페이지에 관심이 많고 적은가

-결제한 사용자가 어떤 페이지에서 결제 전환이 되었는가

-어떤 페이지에서 이탈을 하는가

-재방문 주기 등등

 

 

사용자 행동 데이터 분석시 주의사항

1. 데이터가 기록되는 방식을 정확하게 이해해야한다.

(ex) 회원가입 숫자 데이터 => 회원가입 버튼을 클릭한 숫자 (회원가입을 완료한 수가 아님)

  

2. 데이터는 언제나 잘못 기록될 가능성이 있다. (신뢰도가 낮음. 항상 의심하기)

- 데이터가 쌓이는 조건이 다를수 있다.

- 똑같은 페이지뷰, 클릭 데이터라도 수치에 오차가 있을 수 있다.

 

3.데이터를 조회할떄 주의가 필요하다.

-사용자 행동 데이터가 저장된 DB 쿼리를 잘못 설정하면 데이터 베이스 과부하, 서버 다운이 될 수 있다.