R로 하는 기초통계 [강의자료 ] 패키지 설치 , 엑셀에서 데이터 가져오는 법

  패키지 설치 및 엑셀에서 데이터 가져오는 법은 처음 R을 진입 하려는 초급자들을 위한 준비 교육이다.  실제로 학부에서 R을 배웠을때,  가장 어려운 것은 text,  엑셀 데이터 로딩이 었다.  2000년대 후반에는 상당히 어려운 방법으로 데이터를 읽어 왔다.  물론 그대는 R studio도 없었다.   이번에는 아주  쉬운 방법을 논의 하겠다. 

R packages

1.  R 패키지(package) 설치  

R에서 패키지는 R이나 R studio에서 사용자가 사용하기 쉽게 함수나 데이터 및 실행 코드 등의 객체 들의 묶음으로 라이브러리(library) 하고 부르기도 하며,  일반 적으로  CRAN 사이트에 있다.  

 패키지의 예제를 설명 할때,  엑셀에서 데이터 가져오는 방법을 설명 하겠다. 

   패키지 설치는 엑셀에서 데이터 가져오는 법 중에서 rio와 readxl이라는 패키지가 있다. 

 아래의 명령어로 설치 할 수 있다. 
  install.packages("rio")
  install.packages("readxl")

그런데,  아래와 같이 함수를 만들어서,  패키지가 있으면 로딩 하고, 없으면 설치하는 함수가 있다.  초보자들은 아래의 명령어를 사용해서 패키지를 설치 및 로딩 해도 좋다.  
단  Windows R일 경우이나,  우분투 R일 경우에는 아래의 방법은 추천 하지 않는다. 

# 함수를 만들어서 패키지 로딩
pkg_fun <- function(pkg) {
  if(!require(pkg, character.only = TRUE)) {
    install.packages(pkg)
    library(pkg, character.only = TRUE)  
  }
}
pkg_fun("readxl")
## Loading required package: readxl
pkg_fun("rio")
## Loading required package: rio

아래의 명령어는 현재 실행되고 있는 패키지를 보는 방법이다. 
# 현재 실행 하고 있는 패키지를 모두 보려면 search() 입력
  search()
##  [1] ".GlobalEnv"        "package:rio"       "package:readxl"   
##  [4] "package:stats"     "package:graphics"  "package:grDevices"
##  [7] "package:utils"     "package:datasets"  "package:methods"  
## [10] "Autoloads"         "package:base"

더 이상 패키지가 필요로 하지 않을 때의 명령어는 아래와 같다. 
>  detach(package:readxl)


2. 엑셀에서 데이터 가져오는 법


   엑셀에서  쉽게 데이터를 가져오면,  현재 엑셀 파일의 위치를 알고 있어야 한다. 

예를 들면 아래 조회한  패스에 엑셀 파일이 있다고 가정 하자.  

  >  # 패스 상태 확인

  >  getwd()

[1] "C:/Users/rdmky/Dropbox/통계/1.교육/자율교육/누구나 통계  R"


  위에 폴더에 엑셀 파일이 있다는 확신이 들면  아래의 명령어를 처셔 가져온다. 

# 워킹디렉토리 설정

> setwd("C:/Users/rdmky/Dropbox/통계/1.교육/자율교육/누구나 통계  R")


위의 방법 보다 더 좋은 두가지 방법이 있다.  실제로  내가 가장 많이 사용하는 방법이다. 

첫번째 파일창에서 원하는 폴더를 선택한 다음 Working Directory를 설정 하는 방법이다. 

Working Directory 설정

 실제로 엑셀 화일이 있는 지점에서 위와 같이 선택 하면 된다. 


두번째 방법은  프로젝트를 만드는 방법이다.  R studio 우측 최상단에 아래와 같은 아이콘있다. 

프로젝트 추가 R


위의 그림에서와 같이 프로젝트를 선택한 다음에,  원하는 디렉토리를 찾아가면 된다. 

R 프로젝트 만들기

새로운 디렉토리를 만들어 프로젝트 관리를 하고 싶으면,   New Directory를 선택하고, 있는 디렉토리를 이용하여 프로젝트 관리 하고 싶으면,  Existing Directory를 선택하여, 프로젝트를 만들어 관리 할 수 있다.   프로젝트를 만들게 되면 프로젝트 폴더 안에 파일을 넣으면 된다. 

위치가 정해지면,  아래 예제와 같은 명령어를 사용하여, 엑셀을 읽을 수 있다.  

 # 성적표 데이터 가져오기 readxl

>   df_readxl <- read_xlsx("성적표.xlsx")

> # 성적표 데이터 가져오기 rio

>   df_rio <- import("성적표.xlsx")


두가지 방법의 결과는 같다.  데이터를 읽어 올 때, 어느것이 더 편리 하냐의 문제인데,  최근에 엑셀에서 데이터를 가져오는(import)하는 방법은 rio가 훨씬 좋다.  이유는 rio는 인코딩 문제도 잡아주기 때문이다.   초보자 들에게는 rio 사용을 추천 한다. 


댓글 없음:

댓글 쓰기

css cheat sheet 클래스 선택자, margin(마진), display , center 조정 간단한 구성 요소

 앞에서는 html의 간단한 sheet를 소개 하였습니다.   html은  주로 골격을 나타나는 것이라, 디자인을 하는데는 css로 하여야 합니다.  아래 코드와 같이 css 관련 하여 매우 간단하게 코딩 하겠습니다.  body 부분의 css 코딩  ...