R의 최고의 장점은 다양한 사용자들의 특수한 목적과 로직을 함수 형태의 집합을 패키지(Package) 형태로 배포 하는 것이다.
R Package는 일반 사용자 들도 특정 주제에 잘 사용 할 수 있도록 제 3자가 쉽게 이용할 수 있도록 패키지 형태로 배포 되어 있다.
일반적으로 패키지 공유는 CRAN(The Comprehensive R Archive)를 통해 공유되고 있다.
통계 패키지 R을 별도의 패키지 없이 그냥 사용 하던 시기가 있었다. 2010년 이전까지 였는데, R에서 기본적으로 사용한 Base Package 였다. 그때 까지 만 해도, R은 통계학과 학부생이나 대학원생이 돈을 들이지 않고 통계를 분석 하는 툴 정도 였다.
필자는 2007년에 R을 학부에서 처음 보았고, 회사에서는 2015년에 교육을 받았는데, 그때 까지만 해도, R은 통계학 학부생 들도 사용하기 어려운 넘사벽 이었다.
즉 논문을 쓸 때, 미니탭을 사용하던지, SPSS, SAS 등과 같은 고가의 패키지를 이용 하였고, 업무를 할때는 엑셀로 하였다. 즉 분석은 어느 누군가의 전문적인 분야의 종사자만 할 수 있는 작업 이었다.
통계 패키지 R이 갑짜기 개발로 바뀌고, 이것을 잘 모르는 사람들이 개발 툴 이라고 인식 하게 된 것은 Rstudio와 dplyr이 나왔을 무렵 일것 같다.
Rstudio의 출현 : 2016년 11월
tidyvers Package 발표 : 2016년 8월
알파고와 이세돌의 대결 : 2016년 3월
2016년도에는 세상이 바뀔 것 같은 시간이 었다. 빅 데이터, 인공지능 등..
필자가 2017년에 R을 다시 교육을 받았는데, 역시나 다를까 많이 바뀌어 있었다.
그리고 2018년 2019년도에는 개발도구 순위에 올라 있고, 지금도 그림과 같이 순위에 올라 와 있다.
아래에 있는 tidyvers는 데이터의 수집, 집계, DB 연결, 그래픽 보기등 다양한 패키지들이 함께 묶여 있다. 이 부분에 대해서는 앞으로 계속적으로 글을 이어나갈 생각이다.
즉 이 패키지와 Rstudio가 결합 되었는데, 이것이 없었으면, 지금과 같이 R이 프로그래밍 순위에 오르지 못했을 것이다.
즉 전세계 누군가가 만들어 준 Package 들을 잘만 활용 하면, 어려운 분석 내용도 쉽게 이해 할 수 있게 해 준다.
댓글 없음:
댓글 쓰기