본 포스팅은 Pandas 패키지 라이브러리 원문을 기반으로 하여 작성하였습니다.
2021.09.12 - [Python/Pandas 기초다지기(10분)] - Pandas 객체 생성 포스팅에서 생성한 데이터 프레임을 그대로 활용하겠습니다.
데이터프레임의 상단 및 하단 행 보기
df.head() # df라는 데이터 프레임 상단 행 확인하기
df.tail(3) # df라는 데이터 프레임 하단 행 3줄 확인하기
인덱스 및 열 표시 방법
df.index # df라는 데이터 프레임에 index 확인하기
df.columns # df라는 데이터프레임의 열 확인하기
데이터 프레임을 배열로 전환
DataFrame.to_numpy()는 데이터 프레임 형태의 데이터를 NumPy 표현으로 제공합니다. DataFrame에 다른 데이터 유형이 있는 열이 있는 경우 이는 비용이 많이 드는 작업일 수 있으며, 이는 pandas와 NumPy 간의 근본적인 차이점으로 귀결됩니다. NumPy 배열에는 전체 배열에 대해 하나의 dtype이 있는 반면 pandas DataFrame에는 열당 하나의 dtype이 있습니다. DataFrame.to_numpy()를 호출하면 pandas는 DataFrame의 모든 dtype을 보유할 수 있는 NumPy dtype을 찾습니다. 이것은 결국 모든 값을 파이썬 객체로 캐스팅해야 하는 객체가 될 수 있습니다.
모든 부동 소수점 값의 DataFrame인 df의 경우 DataFrame.to_numpy()는 빠르고 데이터 복사가 필요하지 않습니다.
df.to_numpy()
df2처럼 여러 dtype이 있는 DataFrame인 경우에, DataFrame.to_numpy()는 상대적으로 비쌉니다.
df2.to_numpy()
(Note: DataFrame.to_numpy()는 출력에 인덱스 또는 열 레이블을 포함하지 않습니다.)
데이터 기초 통계 요약 확인
describe()는 데이터의 빠른 통계 요약을 보여줍니다.
df.describe()
데이터 전치(Transpose)
df.T
축으로 정렬
df.sort_index(axis=1, ascending=False)
값으로 정렬
df.sort_values(by = "B")
반응형
'Python > Pandas' 카테고리의 다른 글
Pandas Missing data (0) | 2021.09.15 |
---|---|
Pandas Selection(변수선택) (0) | 2021.09.14 |
Pandas 객체 생성 (0) | 2021.09.12 |
Pandas 텍스트 데이터 다루기 (0) | 2021.08.21 |
Pandas 시계열 데이터 다루기 (0) | 2021.08.20 |
댓글