반응형 데이터 전처리3 데이터 분석을 위한 강력한 Pandas 함수 2 데이터 전처리는 데이터 분석에 있어 가장 중요한 부분이죠. 데이터 전처리 과정에는 정리, 구조 조정, 병합, 중복 제거, Null 또는 NaN 값 제거 등과 같은 다양한 작업이 포함됩니다. Pandas는 다양한 데이터 사전 처리 작업을 진행하기 위해 많은 함수를 제공합니다. Pandas는 Series 및 DataFrame을 포함하는 데이터 작업을 위해 두 가지 유형의 데이터 구조를 제공합니다. 지난번 포스팅에서 데이터 분석을 위한 강력한 Pandas 함수에 대해 1차적으로 알아보았는데요. 데이터 분석을 위한 강력한 Pandas 함수 1 Pandas는 파이썬에서 데이터 정리와 관련하여 국제적 표준과도 같습니다. Pandas는 다차원 배열을 지원하는 Numpy를 기반으로 합니다. Pandas는 Data Sc.. 2022. 6. 6. Python에서 Lambda 함수를 사용하는 5가지 팁 Lambda 함수는 파이썬에서 가장 유용한 함수 중 하나로, 코드 블록을 간단한 한 줄짜리로 바꿀 수 있습니다. 데이터 전처리, 피쳐 엔지니어링 및 기계 학습 워크플로의 거의 모든 곳에서 자주 사용합니다. 그러나 처음 접할 경우, 사용 방법이 다소 어렵게 느껴질 수 있습니다. Lambda 함수를 이해하는 데 도움이 되는 몇 가지 간단한 개념이 있습니다. 이번 포스팅에서는 Lambda 함수를 사용하는 방법에 대해서 알아보겠습니다. import pandas as pd toy = pd.read_csv("D:/Python_apply/toy.csv") toy Lambda 함수의 순서 간단히 말해서 Lambda 함수는 python에서 함수를 호출하는 것과 같습니다. 위의 데이터 예시에서 'install' 항목에 대.. 2022. 6. 4. Pandas 행 단위 연산 - iterrows(), itertuples(), iloc, loc 함수 데이터 분석을 하기 위한 전처리 작업이나 혹은 데이터 조작 시 데이터를 행 단위로 읽어서 처리해야 하는 상황이 많은 데요. 이럴 때, 활용할 수 있는 다양한 방안들이 있는데요. 여기서는 2가지 방안에 대해서 살펴보겠습니다. 실습 데이터: 붓꽃 데이터 조건: 데이터를 행 단위로 읽어 PetalWidth(꽃잎폭)이 0.2보다 작거나 같으면 0, 0.2보다 크고 1보다 작거나 같으면 1, 1보다 크고 2보다 작거나 같으면 2, 2보다 크면 3이라는 값을 가지는 group이라는 변수 생성하기 실습 데이터 1. iloc, loc 함수 활용 해당 함수에 대한 자세한 설명은 아래 링크를 참고해 주세요. [파이썬완전기초]데이터다루기Pandas기본 본 포스팅은 2021 NIPA AI 온라인 무료 교육의 AI 실무 기본 .. 2022. 3. 9. 이전 1 다음 반응형