본문 바로가기
Python/Pandas

Pandas 데이터 보기(Viewing)

by 찐남 2021. 9. 13.
본 포스팅은 Pandas 패키지 라이브러리 원문을 기반으로 하여 작성하였습니다.

 

2021.09.12 - [Python/Pandas 기초다지기(10분)] - Pandas 객체 생성 포스팅에서 생성한 데이터 프레임을 그대로 활용하겠습니다. 

 

 



데이터프레임의 상단 및 하단 행 보기

 

df.head() # df라는 데이터 프레임 상단 행 확인하기

 

df.tail(3) # df라는 데이터 프레임 하단 행 3줄 확인하기

 

인덱스 및 열 표시 방법

 

df.index # df라는 데이터 프레임에 index 확인하기

 

df.columns  # df라는 데이터프레임의 열 확인하기

 

데이터 프레임을 배열로 전환

 

DataFrame.to_numpy()는 데이터 프레임 형태의 데이터를 NumPy 표현으로 제공합니다. DataFrame에 다른 데이터 유형이 있는 열이 있는 경우 이는 비용이 많이 드는 작업일 수 있으며, 이는 pandas와 NumPy 간의 근본적인 차이점으로 귀결됩니다. NumPy 배열에는 전체 배열에 대해 하나의 dtype이 있는 반면 pandas DataFrame에는 열당 하나의 dtype이 있습니다. DataFrame.to_numpy()를 호출하면 pandas는 DataFrame의 모든 dtype을 보유할 수 있는 NumPy dtype을 찾습니다. 이것은 결국 모든 값을 파이썬 객체로 캐스팅해야 하는 객체가 될 수 있습니다.

 

모든 부동 소수점 값의 DataFrame인 df의 경우 DataFrame.to_numpy()는 빠르고 데이터 복사가 필요하지 않습니다. 

df.to_numpy()

 

df2처럼 여러 dtype이 있는 DataFrame인 경우에, DataFrame.to_numpy()는 상대적으로 비쌉니다. 

df2.to_numpy()

(Note: DataFrame.to_numpy()는 출력에 인덱스 또는 열 레이블을 포함하지 않습니다.)

 



데이터 기초 통계 요약 확인

 

describe()는 데이터의 빠른 통계 요약을 보여줍니다.

df.describe()

 

데이터 전치(Transpose)

 

df.T

 

축으로 정렬

 

df.sort_index(axis=1, ascending=False)

 

값으로 정렬

 

df.sort_values(by = "B")

 

 



반응형

'Python > Pandas' 카테고리의 다른 글

Pandas Missing data  (0) 2021.09.15
Pandas Selection(변수선택)  (0) 2021.09.14
Pandas 객체 생성  (0) 2021.09.12
Pandas 텍스트 데이터 다루기  (0) 2021.08.21
Pandas 시계열 데이터 다루기  (0) 2021.08.20

댓글