반응형 데이터처리1 pandas를 활용한 데이터 정리 우리가 현실에서 마주하게 되는 실제 데이터 세트는 정리되지 않은 지저분한(?) 형태이므로 데이터가 분석에 적합하도록 데이터 전처리 또는 정리가 필수적입니다. 데이터 정리에는 1) 데이터 간격 정리 2) 데이터 오류 수정 3) 데이터 세트 결합 4) 데이터 집계 5) 새로운 feature 생성 등이 포함됩니다. 이번 포스팅에서는 pandas를 사용하여 'Marks_data'라는 매우 간단한 데이터 세트를 활용해서 데이터 정리 방법에 대해 설명합니다. 위의 데이터 세트를 다운로드하여 pandas 패키지로 로딩합니다. import pandas as pd # 데이터 로딩 marksData = pd.read_csv('C:\marks_data.csv') marksData marksData.shape # (19, 3.. 2022. 4. 30. 이전 1 다음 반응형