패키지 설치 및 엑셀에서 데이터 가져오는 법은 처음 R을 진입 하려는 초급자들을 위한 준비 교육이다. 실제로 학부에서 R을 배웠을때, 가장 어려운 것은 text, 엑셀 데이터 로딩이 었다. 2000년대 후반에는 상당히 어려운 방법으로 데이터를 읽어 왔다. 물론 그대는 R studio도 없었다. 이번에는 아주 쉬운 방법을 논의 하겠다.
R packages |
1. R 패키지(package) 설치
# 함수를 만들어서 패키지 로딩
pkg_fun <- function(pkg) {
if(!require(pkg, character.only = TRUE)) {
install.packages(pkg)
library(pkg, character.only = TRUE)
}
}
pkg_fun("readxl")
## Loading required package: readxl
pkg_fun("rio")
## Loading required package: rio
# 현재 실행 하고 있는 패키지를 모두 보려면 search() 입력
search()
## [1] ".GlobalEnv" "package:rio" "package:readxl"
## [4] "package:stats" "package:graphics" "package:grDevices"
## [7] "package:utils" "package:datasets" "package:methods"
## [10] "Autoloads" "package:base"
2. 엑셀에서 데이터 가져오는 법
> getwd()
[1] "C:/Users/rdmky/Dropbox/통계/1.교육/자율교육/누구나 통계 R"
# 워킹디렉토리 설정
> setwd("C:/Users/rdmky/Dropbox/통계/1.교육/자율교육/누구나 통계 R")
위의 방법 보다 더 좋은 두가지 방법이 있다. 실제로 내가 가장 많이 사용하는 방법이다.
첫번째 파일창에서 원하는 폴더를 선택한 다음 Working Directory를 설정 하는 방법이다.
Working Directory 설정 |
실제로 엑셀 화일이 있는 지점에서 위와 같이 선택 하면 된다.
두번째 방법은 프로젝트를 만드는 방법이다. R studio 우측 최상단에 아래와 같은 아이콘있다.
프로젝트 추가 R |
R 프로젝트 만들기 |
새로운 디렉토리를 만들어 프로젝트 관리를 하고 싶으면, New Directory를 선택하고, 있는 디렉토리를 이용하여 프로젝트 관리 하고 싶으면, Existing Directory를 선택하여, 프로젝트를 만들어 관리 할 수 있다. 프로젝트를 만들게 되면 프로젝트 폴더 안에 파일을 넣으면 된다.
위치가 정해지면, 아래 예제와 같은 명령어를 사용하여, 엑셀을 읽을 수 있다.
# 성적표 데이터 가져오기 readxl
>
df_readxl <- read_xlsx("성적표.xlsx")
> # 성적표 데이터 가져오기 rio
>
df_rio <- import("성적표.xlsx")
두가지 방법의 결과는 같다. 데이터를 읽어 올 때, 어느것이 더 편리 하냐의 문제인데, 최근에 엑셀에서 데이터를 가져오는(import)하는 방법은 rio가 훨씬 좋다. 이유는 rio는 인코딩 문제도 잡아주기 때문이다. 초보자 들에게는 rio 사용을 추천 한다.
댓글 없음:
댓글 쓰기