본문 바로가기
Python/Pandas

Pandas Grouping

by 찐남 2021. 9. 18.
본 포스팅은 Pandas 패키지 라이브러리 원문을 기반으로 하여 작성하였습니다.

 

"group by"는 다음 단계 중 하나 이상을 포함하는 프로세스를 나타냅니다. 

 

  • Splitting: 일부 기준에 따라 데이터를 그룹으로 분할
  • Applying: 각 그룹에 독립적으로 기능 적용 
  • Combining: 결과를 데이터 구조로 결합

 

import numpy as np
import pandas as pd
df = pd.DataFrame(
________{
__________"A": ["foo", "bar", "foo", "bar", "foo", "bar", "foo", "foo"],
__________"B": ["one", "one", "two", "three", "two", "two", "one", "three"],
__________"C": np.random.randn(8),
__________"D": np.random.randn(8),
________} )
df

 



그룹화한 다음 결과 그룹에 sum() 함수 적용

df.groupby("A").sum()

 

만약, 여러 열로 그룹화하면 계층적 인덱스가 형성되고, 다시 sum() 함수를 적용할 수 있습니다.

df.groupby(["A", "B"]).sum()

 



반응형

'Python > Pandas' 카테고리의 다른 글

Pandas Time series  (0) 2021.09.20
Pandas Reshaping  (0) 2021.09.19
Pandas Merge  (0) 2021.09.17
Pandas Operations  (0) 2021.09.16
Pandas Missing data  (0) 2021.09.15

댓글