본문 바로가기

성동1기 전Z전능 데이터 분석가 과정

[전Z전능 DA] Day32 - PYTHON 기초3

 

함수

 

1. 일반적인 함수

입력값과 리턴값이 있는 함수

 

리턴값을 받을 변수  = 

 

함수명은 작동하는 코드를 나타낼수있게 하는게 좋다 

 

2. 입력값이 없는 함수 

리턴값을 받을 변수  = 함수 이름()

 

3. 리턴값이 없는 함수 

함수이름(입력인수1, 입력인수2, ...)

 

4. 단순 함수 

입력값도 리턴값도 없는 함수 

 

함수이름():

 

 

매개변수 지정해서 호출하기 

매개변수를 지정하면, 매개변수 순서에 상관없이 함수를 사용할 수 있다는 장점이 있다.

 

내장함수

sum()

max()

min()

 

패키지

seaborn

 

패키지 함수 사용법이 궁금할 땐 help함수를 활용해보세요

ex) sns.countplot?

 

 

모듈

패키지명.모듈명.함수명() 으로 함수 사용하기

 


🎯데이터 프레임의 이해

 

데이터가 크다  = 행이 많다 혹은 열이 많다

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

🌵데이터 입력해 데이터 프레임 만들기 

 

 

🌵 특정 변수의 값 추출하기 

 

 

🌵변수의 값으로 합계 구하기 

 

 

🌵변수의 값으로 평균 구하기

 

 


 

3. 외부데이터 이용하기

 

 

 🌱🥑 엑셀파일 불러오기

 

• 현재 주피터랩 작업 파일 경로 알아보기

 

 

  과학 점수 평균 구하기  mean() 함

 

 

🌱🥑  CSV  파일 불러오기

 

 

 

 

🌱🥑 CSV 파일로 저장

 

 


 

🎯데이터 분석 기초

 

더보기

1. 데이터 파악하기

2. 변수명 바꾸기

3. 파생 변수 만들기

 

 

 

1. 데이터 파악하기 

 

데이터 파악 함수

함수 기능
head() 앞부분 출력
tail() 뒷부분 출력
shape 행, 열 개수 출력
info() 변수 속성 출력
describe() 요약 통계량 출력 (숫자 컬럼 한정)
describe(include = 'all') 문자 변수 요약 통계량 함께 출력

 

 

 

데이터프레임 info() 

  • non_null count : 결츨치를 제외하고 구한 값의 개수
  • 변수 속성 :  int64, float64, object(문자), datatime64(날짜 시각)
  • 64: 64비트
    • -1비트로 두개의 값 표현 가능
    • -int64는 2의 64승 개의 정수 표현 가능하다라는 뜻

 

 

 

 

 

 

 

 

min부터 max까지 한몸으로 움직인다 (표준편차 그래프를 생각하며 보면 된다..)

 

 

 

 

 

함수와 메서드 차이 알이보기 

 

sum() : 내장함수 (파이썬 기본 장착 함수)

pd.read_csv() : 패키지 함수 (그래서 패키지 이름을 써주는구나)

df.head() :  메서드 (변수가 지니고 있는 함수)

 

변수의 자료 구조에 따라 사용 가능한 메서드가 다르다

ex. 리스트형 자료에 head()를 사용할 수 없다.

 

attribute : 변수가 지니고 있는 값

메서드는 변수가 지니고 있는 함수

 

 

 

 

2. 변수명 바꾸기

컬럼명.copy() : 복사본을 수정해도 원본은 영향을 받지 않음