본문 바로가기
Python/Pandas

Pandas Missing data

by 찐남 2021. 9. 15.
본 포스팅은 pandas 패키지 라이브러리 원문을 기반으로 하여 작성하였습니다.

 

2021.09.14 - [Python/Pandas 기초다지기(10분)] - Pandas Selection(변수선택)에서 생성한 데이터를 계속 사용하도록 하겠습니다. 

 

pandas는 주로 np.nan 값을 사용하여 missing data를 나타냅니다. np.nan 값은 기본적으로 계산에 포함되지 않습니다. reindex를 사용하면 지정된 축의 인덱스를 변경/추가/삭제할 수 있습니다. 그러면 데이터 복사본이 반환됩니다.

 

df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ["E"])
df1.loc[dates[0] : dates[1], "E"] = 1
df1

 



누락된 데이터 행 삭제

df1.dropna(how="any")

 

누락된 데이터 채우기

df1.fillna(value=5)

 

값이 nan인 부울 마스크 생성

pd.isna(df1)

반응형

'Python > Pandas' 카테고리의 다른 글

Pandas Merge  (0) 2021.09.17
Pandas Operations  (0) 2021.09.16
Pandas Selection(변수선택)  (0) 2021.09.14
Pandas 데이터 보기(Viewing)  (0) 2021.09.13
Pandas 객체 생성  (0) 2021.09.12

댓글