본문 바로가기

성동1기 전Z전능 데이터 분석가 과정

[전Z전능 DA] Day13 - 엑셀과 데이터 리터러시 3

🎯 시트 기반 사례 분석 - RFM 기법으로 CRM 맛보기 등

 

 

 

✅DATA BASE

데이터는 모아둬야 서로 비교하거나 특징을 끄집어 낼 수 있음(비교할 수 있음)  => 잘 모아야함

행 = 레코드 = Row

열 = 필드 = Column

 

 

데이터베이스를 만들 때 (피봇테이블을 가능케 하기위해)

  • 가급적 하나의 시트에몰기
  • 첫 행(row)은 반드시 필드(항목)명을 적는다
  • 데이터(레코드)는 아래로 쌓인다
  • 빈 행(row)과, 빈 열(column)이 없어야한다
  • 셀 병합이 없어야 한다

 

 

도수분포표와 히스토그램

집단(데이터)의 전체 이미지를 살펴보기 위한 가장 쉬운 방법 (도수: 데이터의 개수)

 

 

✅데이터 클렌징

현실에서 수집한 데이터를 분석하기 가능하게 데이터를 고치는 작업

변환 TEXT => 숫자 , 숫자 => 날짜
   날짜 => 요일
분리  한 셀에 뭉쳐진 데이터 분리
제거 중복 데이터, 범주 밖 비정상 데이터
  공백, 빈 셀, 보이지 않는 데이터
  특정 문자 표기 제거

 

 

1. 문자 데이터를 숫자로 변환

  • IF 함수로 특정 문자를 처리 가능한 숫자로 변경  =IF(C3="안왔음",0,1)
  • 메뉴 > 수정 > 찾기 바꾸기 (ctrl + H) > 모두 바꾸기

 

2. 문자로 표시된 숫자를 실제 숫자로 변환 (계산이 안됨)

  • 문자로 입력된 부분의 서식을 숫자로 변경

 

3. 날짜에서 요일 변환 (TEXT 함수)

  • text("2025-08-01","aaaa") = 금요일
  • text("2025-08-01","aaa") = 금
  • 날짜 데이터가 연도, 월, 일이 나눠져 있다며 date함수를 써서 날짜를 붙여주고 그 뒤에 text함수를 써도 됩니다

 

4. 한 셀에 입력된 데이터를 두 개로 나누기

  • 하나의 셀에 여러 데이터가 입력된 경우는 ‘텍스트로 나누기’ 사용

 

5. 중복 항목 삭제

  • '중복된 항목 제거' 기능 사용

 

6. 비정상 데이터 확인

  • 데이터를 살펴보면, 이유는 모르겠지만 튀는 데이터가 있는데요. 이 경우는 어쩔 수 없이 하나하나 처리해 줄 수밖에..

 

7. 다른 형태로 저장된 데이터 같은 형태로 바꾸기

   (데이터를 확보할 때는 데이터 형식을 제한해서 처리하고 봐야할때가 있다)

 

  • 서식>숫자>맞춤 숫자 형식 0##-####-####
  • ctrl + f > 옵션 (모두바꾸기) >  '.' =>  '-'으로 바꾸기
  • 데이터-데이터확인-왼쪽 데이터 확인규칙 -드롭다운 입력거부 옵션 -  규칙위반 팝업이 뜬다(셀 제한걸기 가능)                                                                               -드롭다운 (선택지 추가해서 다른 형태 입력못하게 한다)

 

 

8. 그 외에도 신경써야 하는 요소들

  • 표, 또는 열마다 다른 형식을 사용한 경우
  • 공백 문자
  • 불규칙한 대소문자
  • 불규칙한 날짜 및 시간
  • 오류 값

 

 

✅데이터 처리

가설을 검증함에 데이터가 충분한가? 매출 데이터 (POS, 구매 기록 등)
있는 데이터를 어떻게 변환하면 분석이 가능한 형태가 될까? 날짜에서 요일로 변경해보기 등
추가해야 한다면, 어떻게 데이터를 붙일까? VLOOKUP 등으로 데이터를 연동

 

ifna( ," ") : N/A 제거

 

 


🍎 주어진 데이터를 클렌징해서 피봇 => 차트 => 가설검증, 결론 도출 하는 실습을 했는데 클렌징까지는 어찌저찌 했지만 정렬된 데이터나 차트를 보고 궁금증이 생기지 않아 가설을 세우는데 어려움이 있었다. 강의를 머릿속에 넣고는 있지만 소화를 못시키고 있는 거 같은데.. 실습을 많이 하다보면 나아지는 부분일까..? 끙

 

기초 함수 정리 및 숙지

오늘 실습 내용 다시 해보기