반응형 데이터 시각화2 (EDA)파이썬을 이용한 탐색적 데이터 분석 프로젝트 Kaggle의 Google Play 스토어 데이터 세트에서 EDA 수행 탐색적 데이터 분석(EDA): EDA(Exploratory data analysis)는 모든 데이터 분석에서 중요한 단계입니다. EDA는 데이터 세트에 대한 이해를 바탕으로 패턴 및 이상치(outlier)를 발견하고, 가설을 세우기 위해 데이터 세트를 탐색하는 프로세스입니다. EDA는 데이터 세트의 수치 데이터에 대한 요약 통계를 생성하고, 데이터를 더 잘 이해하기 위해 다양한 그래픽 표현을 생성하는 것을 포함합니다. 이번 포스팅에서는 Python을 이용해서 예제 데이터 세트를 가지고 EDA의 과정을 처음부터 끝까지 수행해 보겠습니다. 사용하고자 하는 Python library는 Pandas, Numpy, matplotlib, sea.. 2022. 7. 22. [R그래픽스]데이터 시각화 본 포스팅은 R for Data Science를 기반으로 작성되었습니다. 1. 소개 “The simple graph has brought more information to the data analyst’s mind than any other device.” — John Tukey — 이 장에서는 ggplot2 패키지를 사용하여 데이터를 시각화하는 방법을 알아보겠습니다. R에는 그래프를 만들기 위한 여러 패키지가 있지만 ggplot2는 가장 훌륭하고 다재다능한 시스템 중 하나입니다. ggplot2는 그래프를 설명하고 작성하기 위한 일관된 시스템인 그래픽 문법을 구현합니다. ggplot2를 사용하면 하나의 시스템을 학습하고 여러 곳에 적용하여 더 빠르게 수행할 수 있습니다. 시작하기 전에 ggplot2에 .. 2021. 7. 17. 이전 1 다음 반응형