반응형 데이터 분석3 알아두면 데이터 분석 시 시간을 절약할 수 있는 16가지 Python 및 Pandas Hacks 1. 객체의 메모리 사용량 확인하기 알아두면 데이터 분석 시 시간을 절약할 수 있는 16가지 Python 및 Pandas Hacks 중 첫 번째는 객체의 메모리 사용량을 확인하는 것입니다. import sys import pandas as pd titanic = pd.read_csv("d:/titanic.csv") sys.getsizeof(titanic) 2. 문자열을 바이트로 변환하기 알아두면 데이터 분석 시 시간을 절약할 수 있는 16가지 Python 및 Pandas Hacks 중 두 번째는 문자열을 바이트로 변환하는 것입니다. s = “I want to convert this string to byte” s.encode( ) 3. 두 개의 리스트 개체 병합하기 알아두면 데이터 분석 시 시간을 절약할.. 2022. 5. 23. 데이터 분석의 70%를 처리할 수 있는 10가지 Python 작업 데이터 분석의 주요 업무는 데이터 사전 처리, 데이터 분석, 기계 학습 모델 생성, 모델 배포와 같은 다양한 작업을 포함합니다. 데이터 분석을 하기 위해서는 첫 번째, 데이터 조작(data handling) 기술을 알아야 합니다. 데이터 조작은 데이터를 읽고, 데이터에서 질문에 답을 얻을 수 있는 형식으로 변환하는 것에서부터 시작됩니다. Python 프로그래밍 언어에는 데이터 조작 및 데이터 분석 작업을 위한 Pandas 라이브러리가 있습니다. 이번 포스팅에서는 데이터 분석을 위해 알아야 할 상위 10가지 Python(pandas) 에 대해서 살펴보겠습니다. 1. Reading Dataset(데이터 읽기) 데이터는 모든 분석의 기본 구성 요소입니다. csv, Excel, 텍스트 등과 같은 다양한 파일 형.. 2022. 5. 21. 데이터 분석을 위한 강력한 Pandas 함수 1 Pandas는 파이썬에서 데이터 정리와 관련하여 국제적 표준과도 같습니다. Pandas는 다차원 배열을 지원하는 Numpy를 기반으로 합니다. Pandas는 Data Science 도구 상자에 추가할 때 장점이 될 수 있습니다. pandas에서는 1인치 길이의 아인슈타인 방정식 { E=mc**2 }보다 길지 않은 간단한 함수를 사용하여 짧은 시간에 큰 작업을 수행할 수 있습니다. Pandas 기능 Pandas는 큰 작업을 쉽게 수행할 수 있게 해주는 매우 빠른 도구입니다. 여기에는 데이터 정리, 누락된 값 채우기, 데이터 정규화, 통계 분석 등이 포함됩니다. Jupyter Notebook에 Pandas 설치 Pandas는 Anaconda 배포판의 일부이며 다음 명령으로 Anaconda 프롬프트를 사용하여.. 2022. 5. 1. 이전 1 다음 반응형