본문 바로가기

Project

(3)
[Sparkle] 서울시 쓰레기통 현황 분석 프로젝트 3 🎯데이터 전처리 유동인구 2023 데이터를 팀원들과 나눠서 필요없는 컬럼 정리하고 ( 컬럼명이 다른 구간이 있어서) 하나로 합친 파일을 pandas에서 불러오려고 하니 되지않았다. pandas로 나눠진 파일을 하나하나 불러와서 하나로 합치려고 보니 encoding이 utf-8과 euc-kr이 섞여있어 이전 합쳤던 데이터가 불러와지지 않았던 걸로 확인된다. 방문자 수가 많은 자치구 찾기 1. 방문자수 컬럼 int로 타입변경 -> 문자열이 섞여 있어 오류남 pd.to_numeric() : 숫자 형식으로 변경시킬 대상으로 스칼라값, list, tuple, series 등을 지정 errors 파라미터 - ignore : 만약 숫자로 변경할 수 없는 데이터라면 숫자로 변경하지 않고 원본 데이터를 그대로 반환 - ..
[Sparkle] 서울시 쓰레기통 현황 분석 프로젝트 2 🎯데이터 구하기 전국 상권 정보 데이터 https://www.data.go.kr/data/15083033/fileData.do 소상공인시장진흥공단_상가(상권)정보_20231231 영업 중인 전국 상가업소 데이터를 제공합니다. (상호명, 업종코드, 업종명, 지번주소, 도로명주소, 경도, 위도 등) [데이터 변경 안내] 1. 상권업종분류 : 표준산업분류 기반 업 www.data.go.kr 주요 관광지점 입장객 통계 https://know.tour.go.kr/stat/visitStatDis/area.do# 지역별현황 > 주요관광지점입장객통계 > 관광지식정보시스템 지역별 주요관광지점입장객 통계: 의 주요관광지별 입장객 수 / 지점수 / 지점유형 현황을 한눈에 보실 수 있습니다. 각 지역 클릭시 해당 지역별 현황..
[Sparkle] 서울시 쓰레기통 현황 분석 프로젝트 1 🎯간단한 EDA 1. 데이터 살펴보기 2. folium으로 쓰레기통 위치 시각화 # map 중심점 설정 center = [37.5608237, 127.0647933] m = folium.Map(location=center, tiles='cartodbpositron', zoom_start=12) for i in trash_raw.index: t_lat = trash_raw.loc[i, '위도'] t_long = trash_raw.loc[i, '경도'] title = trash_raw.loc[i, '상세주소'] folium.Circle([t_lat, t_long], color = 'red', radius=4, tooltip = title, fill_opacity = 50).add_to(m) m 💡지도 스타일..