Pandas Missing data

본 포스팅은 pandas 패키지 라이브러리 원문을 기반으로 하여 작성하였습니다.

pandas는 주로 np.nan 값을 사용하여 missing data를 나타냅니다. np.nan 값은 기본적으로 계산에 포함되지 않습니다. reindex를 사용하면 지정된 축의 인덱스를 변경/추가/삭제할 수 있습니다. 그러면 데이터 복사본이 반환됩니다.

df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ["E"])
df1.loc[dates[0] : dates[1], "E"] = 1
df1

누락된 데이터 행 삭제

df1.dropna(how="any")

df1.fillna(value=5)

pd.isna(df1)