pandas value_counts() 함수
Pandas의 value_counts() 함수는 데이터분석을 하는데 있어, 가장 기초적이면서 일반적으로 사용되는 함수 중 하나입니다. 기본적으로 지정된 열의 각 값(value)에 대한 모든 발생 횟수를 반환합니다. 단순한 방법 이외에 여러 옵션을 사용해서 그 이상의 역할을 수행할 수 있습니다. 시작하려면 먼저 데이터가 필요합니다. 작은 데이터 프레임을 만들어서 여러 가지 옵션을 사용해 보겠습니다. import numpy as np import pandas as pd exData = {"Name": ["James","Dan","Jonathan","Eric","Joanna","Mary","Sue","Jim","Lionel","Tim"], "Sex":["Male","Male","Male","Male","Fem..
2022. 5. 2.
[파이썬 자료형] 튜플(tuple), 딕셔너리(dictionary), 집합(set)
일반적인 프로그래밍 언어와 달리 파이썬에는 특이한 자료형이 있다. 일반적인 통계 분석 프로그램인 SAS와 R에 익숙한 나는 처음 파이썬을 접하게 되었을 때, 이들 자료형에 낯설움을 느꼈다. 튜플(tuple), 딕셔너리(dictionary), 집합(set) 자료형이 바로 그들이다. ※ 기본적인 자료형 (숫자형, 문자, 문자열, 리스트, 불 자료형)은 아래 포스팅 글을 참고하시면 됩니다 [파이썬완전기초] print, 기본자료형, 변수, 주석 본 포스팅은 2021 NIPA AI 온라인 무료 교육의 AI 실무 기본 과정을 기반으로 작성하였습니다. 1. 출력하기 (print) 1.1. 한 문장 출력하기 파이썬의 실행 결과를 화면에 보여주기 위한 함수입니다. 사용 zzinnam.tistory.com 그럼 하나하나씩..
2022. 3. 21.
pandas rank() 함수 - 숫자 데이터의 순위 계산 함수
이번 포스팅에서는 pandas 라이브러리에서 제공하는 숫자형 데이터에 대한 순위를 계산하는 함수 rank()에 대해서 알아보겠습니다. 예를 들어, [393,958,842]의 데이터에 함수를 적용하면 [3,1,2]가 반환됩니다. 기본적으로 동일한 값에 대해서는 해당 값의 순위 평균인 순위가 할당됩니다. DataFrame.rank( axis=0, method='average', numeric_only=NoDefault.no_default, na_option='keep', ascending=True, pct=False ) rank 함수에 대한 인수 설명은 아래와 같습니다. axis: 직접 순위에 대한 인덱스 {0 or ‘index’, 1 or ‘columns’}, default 0 method: {defaul..
2022. 3. 6.