Skip to content

zzhining/public_data_analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

45 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

공공데이터 분석과 시각화

목표

공공데이터를 활용한 데이터 분석 방법을 이해하고, 데이터 획득 방법, 전처리, 시각화 실습을 진행하여 실제 데이터를 활용 및 이해하는 방법을 익히고자 한다

커리큘럼

  • 1주차: 공공데이터 분석의 개요
  • 2주차: 공공데이터를 활용한 데이터 전처리(1)
    • 결측치 처리, 이상치 처리, 중복데이터 처리, 데이터 통합(concat, merge), 집계데이터(groupby)
    • CODE
  • 3주차: 공공데이터를 활용한 데이터 전처리(2)
    • 집계 데이터(crosstab, groupby), 이산화(qcut) 스케일변환(z-score, min-max), 원핫인코딩
    • CODE
  • 4주차: 공공데이터를 활용한 데이터 시각화(1)
    • seaborn, matplotlib을 활용한 데이터 시각화
    • CODE
  • 5주차: 공공데이터를 활용한 데이터 시각화(2)
    • plotly를 활용한 데이터 시각화
    • CODE
  • 6주차: 공공데이터를 활용한 데이터 시각화(3)
    • 지도 시각화(plotly, folium)
    • CODE
  • 7주차: 공공데이터를 활용한 탐색적 데이터 분석
    • 서울 지하철 데이터 탐색적 분석
    • CODE
  • 9주차: 공공데이터를 활용한 수치형 데이터 분석(1)
    • 분류 알고리즘(DecisionTreeClassifier, SVC)
    • CODE
  • 10주차: 공공데이터를 활용한 수치형 데이터 분석(2)
    • 앙상블 모델(RandomForestClassifier, XGBClassifier, VotingClassifier), 하이퍼파라미터 튜닝(GridSearchCV)
    • CODE
  • 11주차: 공공데이터를 활용한 텍스트 데이터 분석(1)
  • 12주차: 공공데이터를 활용한 텍스트 데이터 분석(2)
  • 13주차: 공공데이터를 활용한 시계열 데이터 분석(1)
    • 선형회귀모델, DeterministicProcess, 트렌드(trend)
    • CODE
  • 14주차: 공공데이터를 활용한 시계열 데이터 분석(2)
    • 계절성(seasonality), 주기(cycle), 하이브리드 시계열 예측 모델
    • CODE1, CODE2

주요 수정사항

  • 2주차: 데이터 읽기(read_csv) 경로
  • 6주차: 지도시각화(Stamen Terrain title 사용 시, attr 속성 추가), folium.Rectangle() 객체 생성 시, 인자 할당 방법 변경
  • 7주차: 날짜 형 변환(to_datetime() 호출)

About

공공데이터 분석과 시각화 코드 및 데이터 저장소

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published