레이블이 rstudio인 게시물을 표시합니다. 모든 게시물 표시
레이블이 rstudio인 게시물을 표시합니다. 모든 게시물 표시

R 수열 ( seq, rep, 요인) 수준 생성

  R의 가장 기초적인 부분은 seq(수열), req(반복)을 주로 다루겠다. 

R실무 할 때,  상상 외로,  기초 부분을 많이 다룬다.   하지만,   대부분의 사람들을  기초를 배우는데도 불구하고, 실무에서는 어디에 사용하는지 모르고,  접근 하는 경우가 매우 많다.  아래는 기초적인 내용과,  실무 사례의 예를 들어서 설명 할 예정 이다. 

Rstudio 사용법 및 기본세팅 방법

  Rstudio는 2009년에 개발 되었고,  처음 안 것은 2017년도 되었다.   어찌 되었던  학부에서 통계학을 배우고 있을 때는 2000년대 였으니,  콘솔을 사용한 R을 사용하였는데,  데이터 읽어 오는데,  많이 고생한 기억이 난다.    Rstudio의  R의 통합 개발 툴이 나오면서,  개발의 편리성을 가져다 주었다.  

rdmkyg/rstuido Docker ubunt 20.04 설치 부터, 컨테이너 올리기

Ubuntu 20.04 도커는 가상 환경에서 어떠한 OS에서도 같이 작동 됩니다. 따라서 교육용이나, 아니면, 개발 테스트 용으로 매우 적합 하게 구성 되어 있습니다.

  1. Ubuntu 20.04 Docker 설치


  • 도커 설치전 업데이트 합니다.
  •     $ sudo apt update

  • docker GPG키 및 저장 소를 추가 하기 위해서 crul을 설치 합니다.
  •     $ sudo apt-get install -y ca-certificates curl software-properties-common apt-transport-https gnupg lsb-release

  • GPG 키 인증
  •     curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg

  • repository를 추가 합니다.
  •     echo "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null


  • 도커 엔진을 설치 합니다.
  •     $ sudo apt update
        $ sudo apt-get install docker-ce

  • 도커 버전을 확인 합니다.
  •     $ sudo apt update


  2. Docker 이미지 위치 바꾸기


  • Docker 이미지 디렉토리를 변경 합니다.
  •     $ mkdir /home/dockerImages/

  • docker.servide 파일을 수정 하여, 위치를 바꾸어 줍니다.
  •     $ vi /lib/systemd/system/docker.service

  • 14번째 라인에서 패스를 바꾸어 줍니다.
  • ExecStart=/usr/bin/dockerd -H fd:// --containerd=/run/containerd/containerd.sock 
    --data-root=
    home/dockerImages/
  • 서비스를 중지후 다시 시작 합니다.
  •     $service docer stop
        $service docer stop
        $service docker status
        $service docker start
        $service docker status

  3. Docker UI 관리툴 설치


이건은 바로 디렉토리를 만들어서, 이미지까지 도커허브에서 Pull 한 다음 컨테이너에 올리는 것입니다.
  • 도커 디렉토리 만듭니다.
  •     $ sudo mkdir -p /var/portainer/data

  • 서비스를 도크 허브에서 Pull 합니다.
  •     $ docker run -d -p 9000:9000 --name=portainer --restart=unless-stopped -v /var/run/docker.sock:/var/run/docker.sock -v /var/portainer/data:/data portainer/portaine

  4. rstudio 도커 실행 하기


이건도 마찮가지로, Dock hub 에서 바로 Pull 해서 컨테이너 까지 올리는 것 입니다.
    $ docker run -d -p -v "$(realpath ~/work/rsutido1):/home/rstudio 2201:22 -p 8787:8787 -e PASSWORD=passwd --name my-rstudio-ssh rdmkyg/rstudio.ssh

참고로 빨간색으로 되어 있는 것은 매번 실행 할때 마다 바꾸는 것입니다.

이것과 관련 하여 자세한 내용은 아래의 홈페이지를 참고 하시면 됩니다. 


패키지 관련 사이트 
install.packages("doMC")
‘/usr/local/lib/R/site-library’의 위치에 패키지(들)을 설치합니다.
(왜냐하면 ‘lib’가 지정되지 않았기 때문입니다)
URL 'https://packagemanager.rstudio.com/cran/__linux__/focal/latest/src/contrib/doMC_1.3.8.tar.gz'을 시도합니다
Content type 'binary/octet-stream' length 167194 bytes (163 KB)
==================================================
downloaded 163 KB

* installing *binary* package ‘doMC’ ...
* DONE (doMC)

The downloaded source packages are in
‘/tmp/RtmpWtvZrH/downloaded_packages’



ubuntu 20.04 R studio 설치

   R studio 가 없었으면,  아마도 나는 R을 하고 있지 않을 정도로 통계패키지 R을 쉽게 사용할 수 있는 기능이다.   자동완성기능도 있고,  데이터 객체도 볼 수 있고, 그런데 그 무엇보다 놀라온 것은 R에서 그 어려운 리스트를 쉽게 볼 수 있다는 것이다.   

R 기초 데이터 표준화 (Standardization) 및 데이터 정규화(Normalization) 방법, 유방암 데이터 셋 머신러닝

  데이터 표준화 및 정규화는  머신러닝에 있어서,  매우 중요한 사항이다.   서로 데이터의 크기가 맞지 않을 경우 정확 한 계산을 할 수 없다.    아래는 유방암 데이터 세트이다.  이 데이터는 머신러닝으로 모델 만들기 전에 반드시,  표준화 및 정규화 작업을 해야 하다. 


데이터 스케일



위의 그림을 보면  데이터의 크기 차이가 많이 난다.  이럴 경우에는 전부 스케일 하여,  훈련셋과 테스트 셋을 만들어야 한다. 

R 기초 벡터 (vector) 기초 지식

   R에서 벡터는 여러번 다루었다.  하지만,  벡터(vector)를 모르고서는 R을 이야기 할 수 없다.  데이터 타입이 어떠한지 알아야,  그래프를 그리든,   모델 분석을 하든 어떻게 든 할 수 있다. 

R vector


벡터의 기초지식

우분투 18.04 R Base 4.05 설치 / Rstudio 설치 및 최신 버전 업그레이드


  R은  패키지 중심으로 발전 한다.   가면 갈수록 유명한 패키지들을 설치 하기가 매우 까다로워진다.  이유는 패키지를 설치  할 때,  다른 패키지를 추가 하여 내장 시키기 때문이다. 

  R의 안정적인 최신 기술을 사용하고 싶으면, 주기적으로 R Base와 R Package 업그레이드 되었는지 확인 하여야 한다.  

패키지의 예를 들자면,  tidyverse는 초기 버전에는 dplyr, ggplot2, readr, readxl, stringr...  정도 약 적은 양의 패키지가 내장 되어 있는데,  버전이 업그레이드 되면서 패키지의 양이 늘어 났다.   대표적으로 늘어난 패키지는 data.table 인데, 이것은 빅데이터를 연산 할 수 있는 패키지이다.  

이번에는 R 설치 하는 것과,  최신기술 업데이터 하는 것에 대하여 이야기 하겠다. 
R을 설치 하려면,  레포지트리 등록은 필수 적인데,  사내에 방화벽이 있다고 가정하고,  방화벽에 영향을 받지 않는 80 port 기준으로 이야기 하겠다. 


1. R Base 설치

css cheat sheet 클래스 선택자, margin(마진), display , center 조정 간단한 구성 요소

 앞에서는 html의 간단한 sheet를 소개 하였습니다.   html은  주로 골격을 나타나는 것이라, 디자인을 하는데는 css로 하여야 합니다.  아래 코드와 같이 css 관련 하여 매우 간단하게 코딩 하겠습니다.  body 부분의 css 코딩  ...