반응형 모형검증3 [파이썬실습]신용평가 모형 검증(K-S 통계량 산출하기) K-S통계량은 신용평가 모형의 주요 성능 검증 지표 중의 하나입니다. 해당 통계량이 신용평가 모형에 대한 검증에 어떻게 활용되는지는 2021.07.03 - [CSS(Credit Scoring System)/신용평가모형 검증지표] - [R실습]K-S 통계량 산출하기를 참고하시면 됩니다. 이번 포스팅에서는 파이썬을 활용해서 실습만 진행해 보겠습니다. 본 실습은 jupyter notebook을 사용했습니다. 1. 실습 데이터 준비 상위에 링크되어 있는 데이터를 그대로 사용하겠습니다. test.csv에는 3개의 헤더 포함 33개의 row와 3개의 column이 있습니다. car_kind: 자동차 종류이지만, 여기서는 사람을 구별할 수 있는 id로 간주 prob: 우량 고객일 확률(값이 클수록 우량 고객일 확률이.. 2021. 8. 23. [R실습]PSI 산출하기 1. PSI 개념 신용평가모형의 안정성을 검증하는 지표는 모집단의 안정성을 검증하는 PSI(모집단안정성지수, Population Stability Index)와 평가항목의 안정성을 검증하는 CAR(항목안정성지수, Characteristic Analysis Report) 지표가 있다. 이번 포스팅에서는 PSI에 대해서 알아보자. PSI는 신용평가모형 개발 당시의 신용등급별 분포와 실제 운영할 때의 신용등급별 분포가 유사한지, 아니면 등급의 분포가 변화되었는지 검증하는 중요 지표다. 2. PSI 산출식 PSI는 아래의 수식으로 산출된다. PSI = sum((개발당시 등급별 분포 - 실제 운영 시 등급별 분포) * ln(개발당시 등급별 분포 / 실제 운영 시 등급별 분포)) 산식을 보면 알겠지만, PSI값이 .. 2021. 7. 7. [R실습]Information Value 산출하기 1. IV(Information Value) Information Value(이하 IV로 표현)은 정보이론에서 나온 개념으로 알고 있어요.정보이론에서 단일 항목으로 얼마나 많은 정보량을 포함하고 있는지를 수치적으로 나타냈다고 할 수 있는데요. 이런 개념을 신용평가모형에 그대로 접목시켜 보면, 항목 하나가 우량 고객군과 불량 고객군을 얼마나 잘 구분해 줄 수 있는지에 대한 정보량으로 설명할 수 있어요. IV 수치가 클수록 우량 고객군과 불량 고객군을 잘 구분할 수 있는 정보량이 많은 것이고,반대로 IV 수치가 작을수록 우량 고객군과 불량 고객군을 잘 구분할 수 있는 정보량이 적다는 거죠. 그럼 IV는 어떻게 산출되는지 살펴 보겠습니다. IV = 어떤 기준에 의해서 나누어진 구간별 (우량 고객군의 구성비 -.. 2021. 7. 4. 이전 1 다음 반응형