반응형 파이썬 csv 파일 합치기1 [Python] Pandas를 이용하여 DATA전처리 (지하철DATA) - 데이터 전처리란? 데이터를 분석 및 처리에 앞서 알맞은 형태로 만드는 것이다. - 데이터 전처리 사용 Data 분석, Data 마이닝, 머신/답 러닝 프로젝트에 적용됨 - 데이터 분석 단계 1. 문제 정의 2. 데이터 수집 3. 데이터 전처리 4. 데이터 모델링 5. 시각화 및 탐색 여기서는 데이터 전처리까지만 하도록 한다. 1. 문제 정의 1. 2016에서 승차가 가장 많은 역 Top 5 2. 서울역에서 가장 이동인구가 많은 시간대(승차,하차) 2. 데이터 수집 혹은 아래와 같은 사이트에서 공공데이터 수집 가능합니다. 사이트명 사이트 주소 공공데이터 포털 https://www.data.go.kr/ KT 통신 빅데이터 플랫폼 https://bdp.kt.co.kr/ 서울 열린 데이터 광장 https:/.. 2022. 11. 3. 이전 1 다음 반응형