Series 및 Index에는 배열의 각 요소에 대해 쉽게 작동할 수 있도록 하는 일련의 문자열 처리 방법이 있습니다.
아마도 가장 중요한 것은 이러한 방법이 누락/NA 값을 자동으로 제외한다는 것입니다.
이것들은 str 속성을 통해 액세스 되며 일반적으로 동등한(스칼라) 내장 문자열 메서드와 일치하는 이름을 갖습니다.
주요 문자열 함수에 대한 리스트
- str.lower(): 모든 문자열을 소문자로 변환
- str.upper(): 모든 문자열을 대문자로 변환
- str.len(): 문자열의 길이를 반환
- str.strip(): 문자열에 포함되어 있는 좌/우 공백 제거
- str.lstrip(): 문자열에 포함되어 있는 왼쪽 공백 제거
- str.rstrip(): 문자열에 포함되어 있는 오른쪽 공백 제거
- str.replace(" ", "_"): 공백 문자열을 "_"로 변환
- str.split("_"): 문자열을 "_"로 구분한 후에 리스트로 반환
- str.split("_").str.get(1): 문자열을 "_"로 구분하여 리스트로 반환 후 2번째 요소를 반환
- str.split("_").str[1]:문자열을 "_"로 구분하여 리스트로 변환 후 2번째 요소를 반환 (위의 코드와 결과 동일)
- str.split("_", expand=True): 문자열을 "_"로 구분하여 리스트로 변환 후 리스트의 각 요소를 칼럼으로 반환
- str.split("_", expand=True, n=1): 문자열을 "_"로 구분하여 리스트로 변환 후 첫 번째 요소만 구분한 후 그 외 요소는 결합된 상태로 반환
- str.rsplit("_", expand=True, n=1): 문자열을 "_"로 구분하여 리스트로 변환 후 오른쪽 첫번째 요소만 구분한 후 그 외 요소는 결합된 상태로 반환
- str.replace("old","new"): 문자열 "old"를 문자열 "new"로 변환
- str.cat(): 문자열 결합 함수
- str.slice(): Series 또는 Index의 각 요소에서 부분 문자열을 슬라이스
반응형
'Python > Pandas' 카테고리의 다른 글
Pandas 행 단위 연산 - iterrows(), itertuples(), iloc, loc 함수 (0) | 2022.03.09 |
---|---|
pandas rank() 함수 - 숫자 데이터의 순위 계산 함수 (0) | 2022.03.06 |
pandas 데이터 결합 함수 merge() (0) | 2022.02.13 |
pandas 데이터 구조 소개(DataFrame) (0) | 2022.01.29 |
pandas 데이터 구조 소개(Series) (0) | 2021.10.15 |
댓글