본문 바로가기

성동1기 전Z전능 데이터 분석가 과정

[전Z전능 DA] Day30 - PYTHON 기초 1

🎯데이터 분석 핵심 툴 : 파이썬 강의

 

1. 데이터 분석을 위한 파이썬 기초 1,2,3

2. 파이썬과 데이터분석

3. 한 발 더 나아가는 데이터 과학의 세계 (머신러닝)

 


 

파이썬이란 무엇인가

  귀도 반 로섬

C는 언어는 컴파일 언어 ( 컴퓨터에 직접 명령 수행속도가 빠르다)

PYTHON은 인터프리터 언어 (번역을 거쳐서 컴퓨터에 명령 째끔 느리다)

 

 

-파이썬 왜쓰나요

배우기쉽다

오픈소스언어

간결해서 읽고 쓰기 간편 ( 어떤 문제를 해결할때 답이 정해져있는 경우가 많다)

사용가능한 내장 함수 및 외부라이브러리 (모듈, 패키지)이 굉장히 많음

다른 다양한 언어들과도 쉽게 융합된다 

 


 

파이썬 기초 -  자료형

1.변수

2.기본자료형 - 숫자, 문자, 리스트, 불

3.특별자료형 - 딕셔너리

 

 

1. 변수 (VARIABLE)

다양한 자료형의 값을 저장하는 공간

 

변수를 만들때는 할당 기호를 사용한다

변수이름 =  변수에 저장할 값

 

변수명을 정할때는

알아보기 쉽도록 의미를 담아 정한다

영문자, 숫자, 언더바 를 조합하며 정하며 반드시 문자로 시작해야 한다 

 

 

 

2. 기본 자료형

1. 숫자

정수, 실수 , 8진수, 16진수 

 

1-1 연산자

사칙 연산 +   -   *   / 
제곱 연산 ** 
나머지 연산 % 
몫 연산(정수 구할때) // 

 

 

2. 문자열 (string)

따옴표로 둘러싸여 있으면 모두 문자열이다

 

- len() : 문자열 길이 구하는 함수 

 

- 문자열 인덱싱 : a[n]  a의 n번째 값 

문자열 인덱싱과 슬라이싱 (0부터 시작한다) , 

뒤에서 부터 읽을때는 마이너스 기호를 붙인다 뒤에서부터 시작할때는 -1부터 시작

 

-문자열 슬라이싱

a[n] : 인덱스 n번째 해당하는 문자

a[x:y] : 인덱스 x부터 y-1에 해당하는 문자들

 

-문자열 포매팅  :  문자열 안에 변수를 삽입하는 것

코드 설명
%s 문자열(String)
%c 문자 1개(Character)
%d 정수(Interger)
%f 부동 소수(Floating-point)
%o 8진수
%x 16진수
%% '%' 문자 자체

 

 

-문자열 내장 함수

함수명 설명
a.count(b) a문자열 중 문자 b 의 개수 반환
a.find(b) a문자열 중 문자 b가 처음으로 나온 위치 반환 (찾는 문자가 존재하지 않는다면 -1 반환)
a.join(b) b문자열의 각각의 문자사이에 a를 삽입, (b리스트 요소 사이에 a 삽입)
a.upper() a문자열의 소문자를 대문자로 변환
a.lower() a문자열의 대문자를 소문자로 변환
a.strip() a문자열의 양 옆 공백 제거 ( lstrip() 왼쪽 공백제거, rstrip() 오른쪽 공백제거 )
a.replace(b,c) a문자열의 b문자를 c문자로 대체
a.split(b) b문자를 기준으로 a문자열을 쪼갠다, 반환값은 대괄호[ ] 형태의 리스트 자료형이다

 

 

3. 리스트 

리스트명 = [요소1, 요소2, 요소3,...]

대괄호로 감싸주고 각 요솟값은 쉼표로 구분한다.

어떤 자료형도 포함시킬수 있다.

리스트안에 또다른 리스트를 요솟값으로 가질수 있다.

 

리스트 인덱싱과 슬라이싱

문자열과 동일한 인덱싱을 사용한다 

이중리스트 인덱

 

리스트 연산, 리스트 값 수정하기 , 길이 구하기

함수명 설명
append(x) 리스트 맨 마지막에 x를 추가
sort() 리스트의 요소를 순서대로 정렬 (옵션에 reverse=True/False 오름/내림 차순 정렬)
reverse() 리스트를 역순으로 변환
index() 리스트에 x값이 있으면 x의 인덱스 값을 리턴
insert(a,b) 리스트의 a번째 위치에 b를 삽입 (인덱스 한 칸씩 밀린다)
remove(x) 리스트에서 첫번쨰로 나오는 x를 삭제
pop() 리스트의 맨 마지막 요소를 반환, 해당 요소를 삭제
count(x) 리스트 안에 x요소의 개수를 반환
extend(x) 리스트에 x리스트 더하기

 

 

 

4. 튜플 (TUPLE)

리스트와 거의 비슷하지만...

 

튜플명 = (요소1, 요소2, 요소3, ...)

소괄호로 감싸주고 각 요솟값은 쉼표로 구분한다

리스트와 다른 점은 유플의 요솟값은 바꿀 수 없다

 

t1 = ()

t2 = (1,)      → 1개의 요소를 가질때에도 요소뒤에 쉼표를 반드시 붙여야한다

t3 = (1,2,3)

t4 = 1,2,3        →  소괄호를 생략해도 튜플 생성이 가능하다 

t5 = ('a', 'b', ('ab', 'cd'))

 

 

5.딕셔너리 (오브젝트)

 

딕셔너리명 = { key1: value1, key2: value2, ... }

key와 value를 한 쌍으로 가지는 자료형

각각의 요소가 중괄호로 둘러쌓인 형태 

 

 

 

함수  설명
keys() 딕셔너리의 key값을 dict_keys 객체로 리턴
values() 딕셔너리의 value값을 dict_values 객체로 리턴
items() 키와 벨류의 쌍을 튜플로 묶은 값을 딕_아이템 객체로 리턴
clear() 딕셔너리 안의 모든 요소를 삭제
get(x) x라는 key에 대응되는 value를 반환 (키값이 없으면 null반환)
in x x라는 key가 딕셔너리 안에 있는지 조사 (T/F)