본문 바로가기
반응형

KS통계량2

[파이썬실습]신용평가 모형 검증(K-S 통계량 산출하기) K-S통계량은 신용평가 모형의 주요 성능 검증 지표 중의 하나입니다. 해당 통계량이 신용평가 모형에 대한 검증에 어떻게 활용되는지는 2021.07.03 - [CSS(Credit Scoring System)/신용평가모형 검증지표] - [R실습]K-S 통계량 산출하기를 참고하시면 됩니다. 이번 포스팅에서는 파이썬을 활용해서 실습만 진행해 보겠습니다. 본 실습은 jupyter notebook을 사용했습니다. 1. 실습 데이터 준비 상위에 링크되어 있는 데이터를 그대로 사용하겠습니다. test.csv에는 3개의 헤더 포함 33개의 row와 3개의 column이 있습니다. car_kind: 자동차 종류이지만, 여기서는 사람을 구별할 수 있는 id로 간주 prob: 우량 고객일 확률(값이 클수록 우량 고객일 확률이.. 2021. 8. 23.
[R실습]K-S 통계량 산출하기 1. K-S(Kolmogorov - Smirnov Statistics) 통계량 본래 K-S 통계량(Kolmogorov - Smirnov Statistics)은 서로 다른 두개의 집단이 동일한 분포를 이루고 있는지를 검증하는 검증지표로 통계학의 용어입니다. K-S통계량은 두 집단에 대한 각각의 구성비를 누적해서 산출한 후 그 누적 구성비의 차이가 가장 많이 벌어지는 지점의 수치로 계산됩니다. 이런 통계학의 용어가 신용평가모형에 대한 성능을 측정하는 지표로 어떻게 사용되었을까요? 신용평가모형은 과거의 신용거래 행위를 기반으로 빌린 돈을 미래에 잘 상환할 가능성을 예측하는 통계적 모형입니다. 우리가 흔히 말하는 신용등급, 신용점수는 이러한 통계적 모형에 의해 산출된 확률(=빌린 돈을 미래에 잘 상환할 가능성).. 2021. 7. 3.
반응형