반응형 상자 그림1 Box Plot (분포에서 이상값 감지 및 제거) 머신 러닝에서 특정 데이터 포인트는 다른 데이터 포인트에 비해 모델의 성능이 좋거나 혹은 나쁘게 만듭니다. 이러한 데이터 포인트는 더 자세히 조사하면 데이터 영역 측면에서 매우 비현실적인 경향을 보입니다. 이러한 데이터 포인트를 이상값이라고 하며 이번 포스팅에서는 데이터 세트에서 이상값을 시각화한 다음 감지하고 제거하는 방법을 살펴보겠습니다. 통계에서 이상치는 다른 관측치와 크게 다른 데이터 포인트입니다. 이러한 이상값 데이터 포인트는 실험 오류, 측정의 가변성, 문서 오류 등과 같은 다양한 요인으로 인해 발생할 수 있습니다. 다섯 수치 요약 및 상자 그림(Box Plot) 데이터 세트에서 이상값을 감지하는 가장 널리 사용되는 방법 중 하나는 상자 그림 시각화를 사용하는 것이며, 이 그림을 사용하여 사분.. 2022. 9. 11. 이전 1 다음 반응형