본문 바로가기
반응형

R 프로그래밍/R basic15

데이터 프레임의 열 이름 바꾸기 Cookbook for R을 기반으로 하여 작성하였습니다. 데이터 프레임의 열 이름을 바꾸려고 합니다. 어떻게 처리하면 될까요? 3개의 열이 있는 샘플 데이터 프레임으로 시작해 볼게요. d 2022. 1. 9.
factor level 이름 변경하기 Cookbook for R을 기반으로 하여 작성하였습니다. factor level의 이름을 변경하려면 어떻게 할까요? # 간단한 factor 생성 x 2022. 1. 6.
정렬(sorting)하기 Cookbook for R을 기반으로 하여 작성하였습니다. 벡터, 행렬 또는 데이터 프레임을 정렬하려고 합니다. 어떻게 하면 될까요? 하나씩 살펴보도록 할게요. 벡터(Vector) # 랜덤 하게 정렬된 예시 벡터 생성 v 2022. 1. 5.
데이터 요약(Data summary) 본 포스팅은 R cookbook을 기반으로 하여 작성하였습니다. 데이터(평균, 표준 편차 등)를 그룹별로 분류하여 요약하고 싶다면, 어떻게 해야 할까요? 기본적으로 일부 지정된 변수를 기반으로 데이터를 그룹화하고, 각 그룹에 요약 기능(예: 평균, 표준 편차 등)을 적용하는 세 가지 방법이 있어요. 1. ddply() 함수: plyr 패키지가 필요하지만 사용하기 가장 쉬워요. 2. summaryBy() 함수: doBy 패키지가 필요하지만 사용하기가 쉬운 편이에요. 3. aggregate() 함수: 사용하기가 어려운 편이지만, R의 base에 포함되어 있어요. 어떤 데이터가 존재하고, 각 그룹에 대한 N(수), 변화 평균, 표준 편차 및 표준 오차를 찾고자 한다고 가정해 보죠. 여기서 그룹은 성별과 조건의.. 2021. 12. 31.
[R 그래픽스]정당별 국회의원 의석 수 그래프로 표현하기 오늘은 대한민국 정당별 국회의원 의석 수를 그래프로 표현하는 방법에 대해서 알아보도록 할게요. 최종 표현된 그래프의 모습은 아래와 같아요. 자! 그러면 지금부터 그래프를 그려 보도록 하겠습니다. 위와 같은 그래프를 그리려면 우선 "ggpol"이라는 R 패키지가 필요하기 때문에, 우선, 패키지를 설치하고, 로딩할게요. install.packages("ggpol") # ggpol 패키지 설치 library(ggpol) # ggplo 패키지 로딩 다음에는 정당별 의석 수를 나타내는 데이터 프레임을 생성할게요. (참고로, 「국회법」제33조 제2항 및 제3항에 따른 보고 기준, 2022년 03월 11일 현재 기준의 정당별 의석 수입니다.) df 2021. 12. 19.
[R 그래픽스] 워드 클라우드(Word Cloud) 생성하기 워드 클라우드(Word Cloud)는 단어의 빈도수를 구름 형태로 표현하는 그래픽 기법입니다. 통상적으로 단어의 크기는 빈도수에 비례하여 표현합니다. 워드 클라우드를 설명하는 여러 블로그를 보면, 한글 자연어 분석 패키지인 KoNLP(Korean Natural Language Processing)에서 시작합니다. 하지만, 정작 워드 클라우드를 생성하기 위해서는 아래 2가지만 준비되면 그리기가 가능한 그래픽 기법입니다. 1. wordcloud 패키지 설치 2. wordcloud 표현을 위한 2개의 변수(단어, 빈도수)로 구성된 Data.frame KoNLP패키지는 결국 2번의 데이터 세트를 생성하기 위해 중간 과정에서 필요한 패키지입니다. KoNLP 패키지는 다음 포스팅에서 자세히 다루도록 하겠습니다. 그.. 2021. 10. 31.
[R데이터다루기]문자열 처리하기(기초) 본 포스팅은 R for Data Science를 기반으로 작성되었습니다. 1. 소개 이번 포스팅에서는 R의 문자열 처리를 소개합니다. 문자열이 작동하는 방식과 손으로 문자열을 만드는 방법에 대한 기본 사항을 배우지만 이번 포스팅의 초점은 정규표현식 또는 줄여서 정규식입니다. 문자열은 일반적으로 비정형 또는 반정형 데이터를 포함하고 있는데, 정규 표현식은 문자열의 패턴을 설명하기 위한 간결한 언어이기 때문에 매우 유용합니다. 정규 표현식을 처음 볼 때 매우 당황할 수 있지만 시간이 지나면 곧 이해하기 시작할 것입니다. 1.1. 전제조건 이번 포스팅에서는 핵심 tidyverse의 일부인 문자열 조작을 위한 stringr 패키지에 초점을 맞출 것입니다. library(tidyverse) 2. 문자열 기초 작은.. 2021. 10. 5.
R 워크플로우(Project) 본 포스팅은 R for Data Science를 기반으로 하여 작성하였습니다. 데이터 분석을 진행하다 보면, 언젠가는 R을 종료하고 다른 일을 하고, 그다음 날 이어서 분석을 해야 하는 경우가 자주 발생합니다. 또한 R을 사용해서 분리된 상태를 유지하면서 여러 분석을 동시에 수행해야 하는 경우도 있습니다. 외부 데이터(R에서 생성하지 않은 모든 데이터)를 R로 가져와서 분석 후 R의 수치 결과와 수치를 다시 외부 데이터 형태로 보내야 합니다. 이러한 상황을 처리하려면 두 가지 결정을 내려야 합니다. 1. 현재 분석이 "실제 상황"입니까? 즉, 무슨 일이 있었는지에 대한 지속적인 기록으로 무엇을 저장할 것입니까? 2. 분석이 "진행되고 있는" 곳은 어디입니까? 1. 실제 분석 상황이 무엇인가? R 사용자로.. 2021. 10. 3.
R 워크플로우(기초) 본 포스팅은 R for Data Science를 기반으로 하여 작성하였습니다. 1. 코딩 기초 가능한 한 빨리 플로팅 할 수 있도록 몇 가지 기본 사항을 검토해 보겠습니다. R을 계산기로 사용할 수 있습니다. 1 / 200 * 30 #> [1] 0.15 (59 + 73 + 2) / 3 #> [1] 44.66667 sin(pi / 2) #> [1] 1 2021. 10. 2.
[R프리뷰]RStudio 기본 사용법 1. RStudio 실행 RStudio 까지 설치가 완료되었다면, 아주 단순하고 간단한 프로그램 문장을 작성해 보겠습니다. 우선 RStudio를 실행시켜 보겠습니다. 그러면 아래 그림처럼 4개의 분할된 화면이 보일 꺼에요. ①번 창은 R 프로그램을 효울적으로 작성하고 편집하게 해주는 편집기 역할을 수행합니다. ②번 창은 R에서 사용한 여러 object, 함수 등등을 보여줍니다. (더 자세한 기능을 포함하고 있지만, 우선 이 단계에서는 넘어가도록 하겠습니다.) ③번 창은 실제 R 프로그램을 실행시켜 주는 콘솔(console) 창입니다. ④번 창은 R의 도움말, 그래프 출력, 파일 저장 위치 등을 보여주는 창이다. (더 자세한 기능을 포함하고 있지만, 우선 이 단계에서는 넘어가도록 하자) 이번 실습에서 사용.. 2021. 7. 12.
[R데이터구조]행렬(matrix) 생성하기 1. 행렬(matrix) 설명 이번엔 행렬(matrix)에 대해 알아보자. 행렬(matrix)과 관련된 앞선 포스팅에서도 말했듯이, 행렬은 동일한 변수형을 가지는 2차원 데이터 구조이다. 숫자형 변수만 구성할 수 있는 게 아니란 얘기다. 3, 4는 1개의 행과 2개의 열로 이루어진 숫자형 변수(값)을 가지는 행렬이고, 3 4 는 2개의 행과 1개의 열로 이루어진 숫자형 변수(값)을 가지는 행렬이다. 3, 4 5, 6 은 2개의 행과 2개의 열로 이루어진 숫자형 변수(원소)를 가지는 행렬이다. 유사하게 ("남성","여성")은 1개의 행과 2개의 열로 이루어진 문자형 변수(값)를 가지는 벡터이고, "남성", "20대" "여성", "30대" 는 2개의 행과 2개의 열로 이루어진 문자형 변수(값)를 가지는 벡터.. 2021. 7. 11.
[R데이터구조]벡터(vector) 생성하기 1. Vector 설명 R에서 가장 기본이 되는 데이터 구조는 벡터(Vector)이다. 벡터(Vector)와 관련된 앞선 포스팅에서도 말했듯이, 벡터는 동일한 변수형을 가지는 1차원 데이터 구조이다. 숫자형 변수만 구성할 수 있는 게 아니란 얘기다. (1)은 1개의 숫자형 변수(원소)를 가지는 벡터이고, (1, 2)은 2개의 숫자형 변수(원소)를 가지는 벡터이고, (1, 2, 3)은 3개의 숫자형 변수(원소)를 가지는 벡터이다. 유사하게 ("남성")은 1개의 문자형 변수(원소)를 가지는 벡터이고, ("남성","여성")은 2개의 숫자형 변수(원소)를 가지는 벡터이고, ("남성", "여성", "Female")은 3개의 숫자형 변수(원소)를 가지는 벡터이다. 2. Vecor 생성 그럼 R에서 벡터를 생성시켜 .. 2021. 7. 10.
[R데이터구조]R 데이터 구조 파악하기 R를 활용해서 데이터 분석 밎 모델링을 수행할 때, 가장 중요한 내용 중 하나가 바로 데이터 구조이다. R이 내부적으로 처리하는 데이터 구조는 크게 아래 4가지이다. 1) 벡터(Vector) 2) 행렬(Matrix) 3) 배열(Array) 4) 데이터 프레임(Data frame) 5) 리스트(List) 하나씩 차근차근 살펴보자. 1) 벡터(Vector) R에서 벡터는 1개 이상의 원소를 가지는 동일한 변수형으로 이루어진 1차원 데이터 구조이다. 여기서 중요한 Key Point는 "동일한 변수형" 이라는 것이다. 벡터하면 고등학교 시절(1,2) 와 같은 두 개의 숫자(x,y)로 이루어진 좌표만을 기억할 수도 있다. (R에서는 ("초등학교", "중학교", "고등학교") 로 이루어진 것도 벡터이다. 꼭 숫자로.. 2021. 7. 9.
[R프리뷰]R studio 설치하기 앞선 포스팅(R program 설치하기)에서 설명한 것처럼, 이제는 R을 효율적으로 코딩하기 위해 R studio 를 설치해 보자. 아래 url 주소 클릭 www.rstudio.com prodcut 탭 클릭 RStudio 클릭 데스크탑 PC에서 사용할 예정이므로, RStudio Desktop 클릭 하단에 DOWNLOAD RSTUDIO DESKTOP 클릭 RStudio Desktop 무료 버전 클릭 컴퓨터 운영체제(OS)에 맞는 프로그램 실행 파일 클릭 다운로드 완료 시까지 기다리고, 좌측 하단 클릭 다음 클릭 설치 위치 선택 후 다음 클릭 설치 클릭 설치중 확인 설치 완료 윈도우 시작 프로그램에 Rstudio 프로그램이 설치되어 있음을 확인할 수 있다. 클릭해서 실행시켜 보면, 아래와 같은 창이 보인다... 2021. 7. 8.
[R프리뷰]R program 설치하기 R은 무료 오픈 소스 프로그램으로 누구나 쉽게 다운 받아 사용이 가능하다. R은 전 세계 개발자들이 생성한 수많은 패키지로 구성되어 있어, 그 확장성이 무궁무진하다. R을 잘 사용한다는 말은 곧 R의 패키지와 함수를 많이 알고 있다는 말과 대동소이하다. 하지만! R의 작동 원리 및 기본 문법만 숙지하고 있어도 자신의 생각을 프로그램화 하기에는 어렵지 않다. 1) R을 설치하고, 2) R의 작동 원리를 이해하고, 3) R의 주요 함수를 익히고, 4) 이를 활용하여 여러 프로그램을 작성해 보자. * R의 설치 R 프로그램을 다운받기 위해 다음 URL 주소로 들어가 보자. https://www.r-project.org R: The R Project for Statistical Computing www.r-pr.. 2021. 7. 6.
반응형