1. tidyvers에서 구성되는 패키지
tidyverse는 데이터를 데이터 전처리 단계에서 데이터 로딩, 필터, 집계 , 저장 DB 연결까지 다양하게 지원 되는 Package이다. 심지어 데이터 및 전처리 탐색 단계에서 데이터 모델링 하면서 탐색 하는 케이스가 있다.
그리고, 데이터 전처리 단계에서 그래프의 모양과 모형에 의한 그래프를 확인 하면서 처리 하며,
tidyvers는 기존에 R Base에 있는 모델을 활용 하여, 수십개~ 수백만개의 데이터를 탐색을 할 수 있는데, 그 속도가 매우 빠르다.
tidyverse의 중요성을 강조 하지 않아도 지니 치지 않는데, 현업에서 데이터가 100만개 이상 인것은 엑셀로 계산을 없다. 그래서 R에서 사용하는 대표적인 패키지가 tidyvers 이다.
tidyverse 1.3.1 버전에는 아래와 같은 패키지가 내장 되어 있다. 앞으로 이 블로그에서 아래에 있는 패키지는 설치할 필요성이 없어, 설치에 대한 설명은 생략 하겠다.
- broom (≥ 0.7.6), cli (≥ 2.4.0), crayon (≥ 1.4.1),
- dbplyr (≥ 2.1.1), dplyr (≥ 1.0.5), dtplyr (≥ 1.1.0),
- forcats (≥ 0.5.1), googledrive (≥ 1.0.1), googlesheets4 (≥ 0.3.0),
- ggplot2 (≥ 3.3.3), haven (≥ 2.3.1), hms (≥ 1.0.0), httr (≥ 1.4.2),
- jsonlite (≥ 1.7.2), lubridate (≥ 1.7.10), magrittr (≥ 2.0.1),
- modelr (≥ 0.1.8), pillar (≥ 1.6.0), purrr (≥ 0.3.4), readr (≥ 1.4.0),
- readxl (≥ 1.3.1), reprex (≥ 2.0.0), rlang (≥ 0.4.10),
- rstudioapi (≥ 0.13), rvest (≥ 1.0.0),
- stringr (≥ 1.4.0), tibble (≥ 3.1.0), tidyr (≥ 1.1.3), xml2 (≥ 1.3.2)
2. tidyvers 설치
devtools를 이용하여 설치 하는 것이 매우 안정 적이며 이것도 우분투 터미널을 이용하여 설치 하여야 한다.
댓글 없음:
댓글 쓰기