🎯프로젝트 피드백
<확정이기쁨>
외부데이터 출처와 설명 더 하면 좋았겠다
이상치 처리 할떄 1%정도만 제외하는걸 고려해야한다..?
직장인데이터를 보기로한 근거 부족한거같다
<데이터시대>
가설검증하며 인사이트를 발견하고 생각의 진화 과정을 볼수있어 좋았다
데이터 검증 - 결과가 맘에안들어 - 이부분 다른데이터 가져와서 비교해보자
귀무/대립가설 추가하자
상관관계 히트맵 더 사용
전체이용량 시간대별 이용량 가설을 더 잘게 쪼개봤으면 좋았겠다
오피스 주거지 구분하는 기준, 더 다양한 기준 사용할수있지않았을까(부동산, 등기부등본) 활용하면 더 좋았겟다
지도 사용 이유 합리적, 지도
상관관계가 높지 않은 부분을 결론으로 도출한 부분 좋았다
전체 흐름, 전체 방향상 아쉽다.(어떤식으로 제안을 했고, ) -> 이부분 기억이 안나 ,, 팀원들에게 물어보고 보안하자
파이썬 코드 보고싶다 (이기쁨팀)
팀 커뮤니케이션에서 이걸 하지않고 저걸 했던게 좋았다.
내생각
이김쁨팀 혼합그래프 코드 보고싶다, 지도 히트맵 움직이는거 어떻게 했는지 공금하다
지형별 대여소 수 관계 요소를 산지뿐만아니라 공원위치도 관계가 있는지 보면 좋겠다
승승장구팀의 대여횟수에 양수값, 반납횟수에는 음수값을 부여해 점수를 매긴 부분 신기하고 의미가 있다. 나에게
승승장구팀 동대문디자인플라자 경로 분석, 한강 주변 경로(html) 시각화 궁금
알고리즘 만든거 왕신기
데리만족팀 커널당 감당 용량이 작다 무슨뜻이징 - 컴퓨터가 좋으면 해결된다.
<데이터식스>
팀원 각 1명당 1가설씩 검증한거같아서 약간 따로 논다. (커뮤니케이션 하면서 1가지 주제를 가지고 딥다이브 해보는게 좋겠다 ) 가설부분 연결부분 아쉽다.
결과(시각화)는 많이 냈지만 결론이 부족하지않았나 (이런 부분은 궁금한데 다른데이터 가져와서 추가 분석했으면 좋았겠다. ) 결론에서 나왔던 부족한점에 대해서 물고 늘어졌으면 좋았겠다.
이용량 그래프 고장량 그래프 따로 그림 - 비교를 위한 시각화는 한장에 그리면 좋았겠다
가설들이 모호하다 - 상관관계가 있을것이다에 대한 가설은 어떻게
차이가 뚜렷할것이다 - 어떤 차이, 무슨차이가 것인지 가설의 방향성을 정확히 하는게 좋다
미세먼지 많았던달 가져와서 같이 비교했으면 좋았겠다
1월이용량-1월미세먼지 이용량 이렇게 쪼개서 가져와 분석했으면 용량도 괜찮았을거고 의미도 있었을것이다.
<승승장구>
의사결정트리를 이용한 예측모델 만들어본것 (알고리즘은 아님)
외국인 평균 사용량 59분 (외국인은 대여권 시간이 다르게 판매가 된다 )
활용한 비즈니스적인 인사이트 좋았다.
경로 분석이라는 말보다 좀더 디테일한 단어 사용했으면 좋겠다 ~~스테이션 경로 분석
unnamed:0 csv 파일에 빈 열,행이 있었다. 불러오기할때 옵션을 설정할수 있으므로 이용하다
유의미한 변수로 접근한것 좋았다.
모델링 변수 설정할때 상관관계를 보고 정하는 과정이 꼭 있어야 했다. 추가하면 좋겠다.
정확도가 비교적 높지 않다. 나무 깊이가 3이면 단순한 모델이다 복잡도를 좀 높이는 과정이 필요하다 (엔지니어링)
모델링 결과만 나왔는데 성능지표를 보고 해석하는 과정 필요 . 각각의 값이 의미하는 바를 추가하면 좋겠다.
<데리야끼>
이용량 한대당 고장율을 봤으면 좋았겠다. (가설채택-검증-인사이트내다가-이건 좀 확인해볼필요가 있다로 발전하는 형태로 딥다운 하면 좋겠다.)
가설마다 결론을 적어두는게 좋다.
보기쉽게 목차 정리 좋았다.(특히 Da는 분석양이 많기때문에 목차를 꼭 넣는게 좋다, 가독성도 꼭 고려하기)
가설의 방향성이 있어야 한다. 영향이 있다 상관관계가 있다 보다는 ~~떄문에 ~~가 될것이다 ,~~~한 이유로 ~~되었다 등
결과에 대한 결론이 (어떤 가설이 채택되었다 보다는) 인사이트를 적기. 내용 요약이 아니고.
데이터를 시간대를 나눠서 비교하는것이 좋았을것같다 (유동인구 데이터)
대여수 대여소 거리 - 지형을 가져와서 더 깊게 했어야 했고, 직선거리가 아니라 실제 이동거리? 로 분석했으면 좋았겠다.
<김가네>
비즈니스적 인사이트를 뽑은것 좋았다
데이터 분석을 하는 프로세스를 나름 구축해서 진행한점 좋았다.
생활인구수-대여량: 시간대도 같이 했으면 유의미한 데이터가 나왔을거같다 ,
직장인 관련 가설 검증-
결론에 오피스 밀집지역 못한점 아쉬웠다 (부동산 , 등기부등본 활용하면 좋겠다)
가독성 좋았다. 목차까지 있으면 베스트
모든가설에 왜 선형회귀분석으로 인과관계를 봤는지 궁금하다 : corr을 보고나서 인과관계도 있는지 궁금해서 진행했다.
선형회구는 예측모델에서 진행한다-향목님피셜
<전체피드백>
보고서 할때 꼭 데이터 소개 넣어야한다
목차정렬 꼭 넣기 (보는사람, 듣는사람 입장에서 생각하면서 가독성고려해서)
뚜렷한 목적을 정해놓고 , 정해진 시간안에 결과물을 도출
🎯현직자 특강 이정빈 멘토님
1. 강사소개
2. 데이터직무
3. 데이터분석
4. it업계
5. 다양한 진로
데이터 직무
예측분석
마케팅 분석
고객 인사이트
비지니스 성과분석
인공지능
빅데이터
취업사이트에 데이터를 검색해봐 - 엄청많다 - 뭘 요구하는지 기술스펙을 하나하나 체크해서 검색해봐- 내가 잘하고있는지 감을 잡을수있숴
DA
코딩능력
데이터 활용 SQL 능력
데이터 분석 & 모델링 & 통계 능력
비즈니스/도메인 지식
커뮤니케이션 능력 (설득하는 능력, 발표 능력)
시각화 역량
분석을 위한 통계 지식
데이터분석
⚡문제정의 - 데이터 수집 - 데이터전처리 - 데이터모델링 - 시각화,탐색
1. 문제정의 : 분석대상의 이해 객관적이고 구체적으로 분석
- 도메인 지식 수집
- 문제 분석
- 문제 정의
2. 데이터 수집 : 필요한 데이터 요건정의, 데이터 소재 파악 및 확보
- 공공데이터
- 사설데이터(네이버API등)
- 데이터바우처 지원사업 (필요한 데이터가 없을때 국가에 신청할수있다. 시간이 오래필요 사업계획서도 필요)
3. 데이터 전처리: 오류 사항 점검 및 조치 데이터 구조 및 특성변경
4. 데이터 모델링: 다양한 관점을 반영한 데이터설계 관련 테이블간 관계설정
5. 시각화, 탐색: 다양한 유형의 데이터 시각화 문제 해결을 위한 인사이트 도출
'성동1기 전Z전능 데이터 분석가 과정' 카테고리의 다른 글
[전Z전능 DA]Day42 - 태블로 2 (0) | 2023.12.13 |
---|---|
[전Z전능 DA]Day41 - 태블로 1 (0) | 2023.12.11 |
[전Z전능 DA]Day39 - PYTHON 프로젝트 4 (2) | 2023.12.07 |
[전Z전능 DA]Day38 - PYTHON 프로젝트 3 (1) | 2023.12.06 |
[전Z전능 DA]Day37 - PYTHON 프로젝트 2 (1) | 2023.12.05 |