반응형 Python/Pandas37 Pandas 테이블 구조 변경 방법 본 내용을 보기 전에 Python 사전 준비 및 Python 완전 기초를 먼저 이해하셔야 합니다. 본 포스팅은 pandas 공식 홈페이지를 기반으로 작성하였습니다. 앞선 포스팅에서 계속 사용했던 titanic 승객 데이터와 air quality 데이터를 계속 사용하겠습니다. import pandas as pd titanic = pd.read_csv("D:/python_exer/titanic.csv") titanic.head() air_quality = pd.read_csv("D:/python_exer/air_quality_long.csv", index_col = "date.utc", parse_dates = True) air_quality.head() 1. 테이블 구조 변경 방법 1.1. 행 정렬 1.1.. 2021. 8. 18. Pandas 활용 요약통계량 생성하기 본 내용을 보기 전에 Python 사전 준비 및 Python 완전 기초를 먼저 이해하셔야 합니다. 본 포스팅은 pandas 공식 홈페이지를 기반으로 작성하였습니다. 실습에 활용할 데이터는 titanic 승객 데이터입니다. 우선 python 내 데이터 프레임으로 변환하겠습니다. import pandas as pd titanic = pd.read_csv("D:/python_exer/titanic.csv") titanic.head() 1. 요약통계량 생성 방안 1.1 타이타닉 승객의 평균 연령 구하기 titanic.mean() 다양한 통계량을 사용할 수 있고, 숫자 데이터가 있는 열에 적용할 수 있습니다. 일반적으로 누락된 데이터는 제외하고 기본적으로 여러 행에서 대해서 작업합니다. 1.2. 타이타닉 승객의 .. 2021. 8. 17. Pandas 신규 Column 생성 본 내용을 보기 전에 Python 사전 준비 및 Python 완전 기초를 먼저 이해하셔야 합니다. 본 포스팅은 pandas 공식 홈페이지를 기반으로 작성하였습니다. 2021.08.15 - [Python/Pandas 기초익히기] - Pandas에서 플롯 생성 방안에서 사용한 실습 데이터를 계속 사용하겠습니다. import pandas as pd air_quality = pd.read_csv("D:/python_exer/air_quality_no2.csv", index_col=0, parse_dates=True) air_quality.head() 런던 스테이션의 NO2 농도를 mg/m3으로 표현하려고 하면 어떻게 해야 할까요? (온도 25도, 기압 1013hPa라고 가정하면 환산계수는 1.882) 아래와 같.. 2021. 8. 16. Pandas에서 플롯 생성 방안 본 내용을 보기 전에 Python 사전 준비 및 Python 완전 기초를 먼저 이해하셔야 합니다. 본 포스팅은 pandas 공식 홈페이지를 기반으로 작성하였습니다. 우선, 이번 포스팅에서 학습할 데이터를 다운로드하시길 바랍니다. (이번 포스팅에서는 NO2에 대한 대기질 데이터(openaq에서 제공하고 py-openaq 패키지를 사용)를 사용합니다. air_quality_no2.csv 데이터 세트는 각각 파리, 앤트워프 및 런던에 있는 측정 스테이션 FR04014, BETR801 및 런던 웨스트민스터에 대한 NO2 값을 제공합니다.) 위의 예제 파일을 Python 내부로 불러오겠습니다. import pandas as pd import matplotlib.pyplot as plt air_quality = p.. 2021. 8. 15. Pandas 데이터프레임의 부분 데이터 세트 선택 방법 본 내용을 보기 전에 Python 사전 준비 및 Python 완전 기초를 먼저 이해하셔야 합니다. 본 포스팅은 pandas 공식 홈페이지를 기반으로 작성하였습니다. 이번 포스팅에서 사용할 데이터는 2021.08.13 - [Python/Pandas 기초익히기] - Pandas 표 데이터 입/출력 및 데이터 확인에서 활용한 titanic 승객 데이터를 계속 활용하겠습니다(titanic 승객 데이터의 위의 포스팅에서 다운로드하시면 됩니다.). import pandas as pd titanic = pd.read_csv("D:/python_exer/titanic.csv") 1. 데이터프레임의 부분 데이터 세트 선택 방법 1.1. 특정 열(column) 선택 타이타익 승객 데이터 중에서 나이에 관심이 있어, Age.. 2021. 8. 14. Pandas 표 데이터 입/출력 및 데이터 확인 본 내용을 보기 전에 Python 사전 준비 및 Python 완전 기초를 먼저 이해하셔야 합니다. 본 포스팅은 pandas 공식 홈페이지를 기반으로 작성하였습니다. Python은 pandas 라이브러리를 활용해서 외부 데이터를 불러오고, 데이터 분석을 수행한 후에, 다시 외부 데이터로 내보낼 수 있습니다. Python 내부로 불러들일 때에는 read_* 구문을 활용하고, 외부로 내보낼 때에는 to_* 구문을 활용합니다. 실습을 위해 프로그램 작성 시 가장 많이 활용되는 데이터 중의 하나인 titanic 승객 데이터를 사용하겠습니다. 우선, 실습 데이터를 다운로드하세요. CSV 파일로 제공되는 titanic 승객 데이터를 분석해 보도록 하겠습니다. 1. 파일 불러오기 외부 파일을 불러올 때는 pandas .. 2021. 8. 13. Pandas가 처리하는 데이터 종류 본 내용을 보기 전에 Python 사전 준비 및 Python 완전 기초를 먼저 이해하셔야 합니다. 본 포스팅은 pandas 공식 홈페이지를 기반으로 작성하였습니다. 1. Pandas 시작 앞선 포스팅(pandas 패키지 소개)에서 pandas 라이브러리를 설치했다면, 이제 pandas 라이브러리를 사용할 준비가 되었다고 할 수 있습니다. Python에서 pandas 라이브러리를 사용하기 위해서는 아래와 같이 입력합니다. import pandas as pd pandas에 대한 커뮤니티 동의 별칭은 pd이므로 pandas를 pd로 로드하는 것은 모든 pandas 문서에 대한 표준적인 관행으로 간주됩니다. 1.1. Pandas 데이터 테이블 표현 2. 간단한 데이터 프레임 생성 테이블에 데이터를 수동으로 저장.. 2021. 8. 12. 이전 1 2 다음 반응형