pandas value_counts() 함수
Pandas의 value_counts() 함수는 데이터분석을 하는데 있어, 가장 기초적이면서 일반적으로 사용되는 함수 중 하나입니다. 기본적으로 지정된 열의 각 값(value)에 대한 모든 발생 횟수를 반환합니다. 단순한 방법 이외에 여러 옵션을 사용해서 그 이상의 역할을 수행할 수 있습니다. 시작하려면 먼저 데이터가 필요합니다. 작은 데이터 프레임을 만들어서 여러 가지 옵션을 사용해 보겠습니다. import numpy as np import pandas as pd exData = {"Name": ["James","Dan","Jonathan","Eric","Joanna","Mary","Sue","Jim","Lionel","Tim"], "Sex":["Male","Male","Male","Male","Fem..
2022. 5. 2.
pandas rank() 함수 - 숫자 데이터의 순위 계산 함수
이번 포스팅에서는 pandas 라이브러리에서 제공하는 숫자형 데이터에 대한 순위를 계산하는 함수 rank()에 대해서 알아보겠습니다. 예를 들어, [393,958,842]의 데이터에 함수를 적용하면 [3,1,2]가 반환됩니다. 기본적으로 동일한 값에 대해서는 해당 값의 순위 평균인 순위가 할당됩니다. DataFrame.rank( axis=0, method='average', numeric_only=NoDefault.no_default, na_option='keep', ascending=True, pct=False ) rank 함수에 대한 인수 설명은 아래와 같습니다. axis: 직접 순위에 대한 인덱스 {0 or ‘index’, 1 or ‘columns’}, default 0 method: {defaul..
2022. 3. 6.
Pandas Categoricals
본 포스팅은 Pandas 패키지 라이브러리 원문을 기반으로 하여 작성하였습니다. Pandas는 DataFrame에 범주형 데이터를 포함할 수 있습니다. df = pd.DataFrame( ________{ ___________"id": [1, 2, 3, 4, 5, 6], ___________"raw_grade": ["a", "b", "b", "a", "a", "e"] ________} ) raw_grade의 값들을 범주형 자료 유형으로 변환할 수 있습니다. df["grade"] = df["raw_grade"].astype("category") df["grade"] 범주 이름을 보다 의미 있는 이름으로 변경하는 것이 좋습니다. df["grade"].cat.categories = ["very good", "g..
2021. 9. 21.
Pandas Reshaping
본 포스팅은 pandas 패키지 라이브러리 원문을 기반으로 하여 작성하였습니다. 1. Stack tuples = list( _______________zip( ____________________*[ ["bar", "bar", "baz", "baz", "foo", "foo", "qux", "qux"], _____________________["one", "two", "one", "two", "one", "two", "one", "two"], ] ___________________) ______________) tuples index = pd.MultiIndex.from_tuples(tuples, names=["first", "second"]) index df = pd.DataFrame(np.random...
2021. 9. 19.
Pandas Grouping
본 포스팅은 Pandas 패키지 라이브러리 원문을 기반으로 하여 작성하였습니다. "group by"는 다음 단계 중 하나 이상을 포함하는 프로세스를 나타냅니다. Splitting: 일부 기준에 따라 데이터를 그룹으로 분할 Applying: 각 그룹에 독립적으로 기능 적용 Combining: 결과를 데이터 구조로 결합 import numpy as np import pandas as pd df = pd.DataFrame( ________{ __________"A": ["foo", "bar", "foo", "bar", "foo", "bar", "foo", "foo"], __________"B": ["one", "one", "two", "three", "two", "two", "one", "three"], __..
2021. 9. 18.