반응형 판다스2 Pandas 데이터를 그룹화하는 가장 좋은 방법(groupby, Grouper) 데이터를 분석 경험이 있으신 분들은 'groupby'가 가장 많이 사용되는 함수 중 하나라는 것에 모두 동의하실 겁니다. 그래서 이번 포스팅에서는 groupby를 사용하는 방법과 이와 연관된 Grouper의 활용법에 대해 살펴보겠습니다. 비행기록과 관련된 데이터를 활용하겠습니다. 데이터는 R nycflights13 라이브러리에 있는 flights 데이터 입니다. 우선 Pandas와 Numpy를 임포트 하고, 데이터를 불러오겠습니다. import pandas as pd import numpy as np flights = pd.read_csv("D:/Python_apply/flights.csv") flights.shape 데이터는 약 33만개, feature는 19개 정도 있네요. 데이터에 대한 간단한 정보.. 2022. 6. 1. 데이터 분석의 70%를 처리할 수 있는 10가지 Python 작업 데이터 분석의 주요 업무는 데이터 사전 처리, 데이터 분석, 기계 학습 모델 생성, 모델 배포와 같은 다양한 작업을 포함합니다. 데이터 분석을 하기 위해서는 첫 번째, 데이터 조작(data handling) 기술을 알아야 합니다. 데이터 조작은 데이터를 읽고, 데이터에서 질문에 답을 얻을 수 있는 형식으로 변환하는 것에서부터 시작됩니다. Python 프로그래밍 언어에는 데이터 조작 및 데이터 분석 작업을 위한 Pandas 라이브러리가 있습니다. 이번 포스팅에서는 데이터 분석을 위해 알아야 할 상위 10가지 Python(pandas) 에 대해서 살펴보겠습니다. 1. Reading Dataset(데이터 읽기) 데이터는 모든 분석의 기본 구성 요소입니다. csv, Excel, 텍스트 등과 같은 다양한 파일 형.. 2022. 5. 21. 이전 1 다음 반응형