r package mirror 사이트 |
R CRAN Mirror site 패키지 선택 하여 설치
Windows Docker 설치 with R 과 Rstudio
windows에서 linux 기반의 R 을 설치 해도 일반 linux 기반의 R의 잘 돌아 간다.
특히 요새 윈도우 버전에 업그레이드 되면서, 계정이름이 한글로 된 학교 사용자들이Windows R을 사용할때 아래와 같은 문제가 발생 된다.
Warning message:
In normalizePath(path.expand(path), winslash, mustWork) :
path[1]="C:/Users/???/Documents": 파일 이름, 디렉터리 이름 또는 볼륨 레이블 구문이 잘못되었습니다
anaconda jupyter notebook에 R 설치
ananconda jupyter notebook에서 R을 사용한다는 것을 R을 가지고 html 문서화를 할 수 있다는 이야기 이다. R에서는 Markdown이 있는데, 이것보다는 좀 더 편하게 표현 할 수 있다. jupyter notebook 을 사용할 때는 거의 강의 할 때 사용한다. 하지만, 버전이 낮다는 단점이 있다.
ubuntu 20.04 R 4.1 설치 및 devtools
R 은 패치기 들이 엄청나게 많다. 패치가 얼마나 많은 지는 모르겠지만, 최근에 cran packages에서 4,000개 이상 추가 되었다는 내용이 있었다.
For additional binary packages for R (currently well over 4,000+)
기본적인 지식만 있으면, 얼마든지 R에 있는 패키지를 이용하여 모든 것을 할 수 있다. 나는 R 패키지를 많이 쓰고 있지는 않는다 약 100개 정도 이다.
Windows 64 bit Rstudio에서 R 64Bit rJava 설치 후 로딩 오류 문제
Windows R에서 자바 설치 하는 방법을 찾는 것도 쉽지 않은 일이다. 나는 아래와 같이 KoNLPR 설치 하려는 도중 아래와 같이 오류를 발견 하였다.
https://rdmkyg.blogspot.com/2021/05/konlpr-windows-r.html
Error: package or namespace load failed for ‘rJava’:
.onLoad가 loadNamespace()에서 'rJava'때문에 실패했습니다:
호출: fun(libname, pkgname)
에러: JAVA_HOME cannot be determined from the Registry
Windows R 4.1.1 Rstudio 2021.09.0 버전 한글 오류 발생
Rstudio 4.1.1 버전하고 Rstudio 2021.09.0의 계정 이름이 한글 일 때 아래와 같은 오류가 발생 한다.
package ‘devtools’ successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\???\AppData\Local\Temp\Rtmp4OMPZc\downloaded_packages
Warning message:
In normalizePath(path.expand(path), winslash, mustWork) :
path[1]="C:/Users/???/Documents": 파일 이름, 디렉터리 이름 또는 볼륨 레이블 구문이 잘못되었습니다
error writing code to file C:/Users/����/AppData/Local/Temp/c4cc-da95-1f7b-a9ea: system error 3 (������ ��θ� ã�� �� �����ϴ�)
Error in file(filename, "r") : Ŀ�ؼ��� �� �� �����ϴ�
Calls: sourceWithProgress -> parse -> file
�߰�����: �������(��):
In file(filename, "r") :
���� 'C:/Users/????/AppData/Local/Temp/c4cc-da95-1f7b-a9ea'�� ���µ� �����߽��ϴ�: Invalid argument
������ �����Ǿ����ϴ�
오늘도 데이터에서 url 엑셀 데이터 오류가 날때
오늘도 데이터는 데이터셋을 구글 클라우드에 올려 놓고, 명령어를 치면 url 에서 데이터를 가져오는 방식으로 한다.
그런데 그동안 잘 되다가 엑셀 파일을 읽으려고 할 때 아래와 같은 오류가 발생 할 수 있다.
# 패키지 로딩
library(readxl)
library(httr)
# 데이터 셋 가져오기
url = "https://drive.google.com/u/0/uc?id=1txatfA9L88BFAfDKKXbqfGMSw6TBfwhQ&export=download"
GET(url, write_disk(tf <- tempfile(fileext = ".xlsx")))
demand <- read_excel(tf, 1L)
Error in read_fun(path = enc2native(normalizePath(path)), sheet_i = sheet, : 함수 'Rcpp_precious_remove'는 패키지 'Rcpp'에서 제공된 것이 아닙니다
그럴 때, Rstudio나 R 콘솔에서 아> 래와 같은 명령어를 치면 해결이 된다.
> update.packages()
또는
> install.packages('Rcpp')
ubuntu MSsql 설치 및 R 연결
R Oracle 설치 난이도 최상 ubuntu 18.04
R에서 Tensorflow GPU 실행 하기 우분투 18.04
Winoows 4.1 Issue 패키지 설치 안됨
아래 네이버 지식인으로 부터 질문이 왔다.
‘C:/Users/kboly/Documents/R/win-library/4.1’의 위치에 패키지(들)을 설치합니다.
(왜냐하면 ‘lib’가 지정되지 않았기 때문입니다)
Warning in install.packages :
package ‘dplyer’ is not available for this version of R
A version of this package for your version of R might be available elsewhere,
see the ideas at
https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages
KoNLP R 설치 Windows R 버전
KoNLPR는 형태소 분석기 이다. 사내에 방화벽이 없다면 아래와 같이 git-hub로 설치가 가능 하다.
아래의 예제는 테스트 차원에서 간단하게 명사만 추출 한것이다.
# 아래 패키지를 설치 하신 후에
install.packages("multilinguer")
# 의존성을 설치 한다.
install.packages(c('stringr', 'hash', 'tau', 'Sejong', 'RSQLite', 'devtools'), type = "binary")
# Git hub로 설치 한다.
install.packages("remotes")
remotes::install_github('haven-jeon/KoNLP', upgrade = "never", INSTALL_opts=c("--no-multiarch"))
# KoNLP 예제
library(KoNLP)
## Checking user defined dictionary!
sentence <- '아버지가 방에 스로륵 들어가신다.'
extractNoun(sentence)
## [1] "아버지" "방" "스로륵"
Windows R 관리자 권한으로 실행
Windows R은 관리자 권한으로 실행하지 않으면 패키지도 로딩이 안되고,
제대로 패키지를 설치 할 수 없다. 따라서 제대로 설치 하고 실행 하려면,
아래와 같이 관리자 권한으로 실행 하여야 한다.
1.아이콘에서 관리자 권한 실행 법
2.실행 시 관리자 권한 실행 법
실행 할때 마다 관리자 권한으로 해야 한다.
R 패키지 ubuntu 에 안정적 설치
Windows 버전에서는 패키지 설치가 아주 쉽지만, Ubuntu 버전은 패키지 설치가 매우 어렵다. Linux 특성 상 의존성 에러가 나기 때문이다. 그래서 여러가지 방법으로 패키지를 설치 하는 방법을 설명 하고자 한다. 어찌 되었든 세팅에 가장 애를 많이 먹는 것은 Ubuntu이다. Windows는 세팅을 쉽지만, 개발 할 때, 여러가지 문제점이 발생된다.
1. sudo user root 계정으로 설치
ubuntu R 4.1.0 버전 ggplot2 Crash error 해결 방법
R을 사용할때, .1 버전은 개발 버전이다. 즉 4.0, 4.2 는 괞찮은데, 4.1, 4.3 으로 가면 개발 버전이기 때문에 오류가 발생 한다.
이번에 우분투(ubuntu) sudo apt-get upgrade 하면서 4.05 에서 4.1 대로 업그레이드 되었는데, 아래 화면과 같이 ggplot2 에러가 발생되었다.
The previous R session was abnormally terminated due to unexpected crash.
You may have lost work space data as a result of this crash
그냥 삭제 후 다시 설치 하는 것이 제일 좋다. R 3.6 버전으로 다운그레이드 한다.
R 3.6 버전으로 다운그레이드 하려면 정말 임시동안 이것을 사용해야 한다.
R 기본 버전을 삭제 한다.
sudo apt purge r-base* r-recommended r-cran-* sudo apt autoremove sudo apt update
아래 명령어를 쳐서 기존 레포지트리에 주석 처리 한다.
$ sudo vi /etc/apt/sources.list
새로운 레포지트리를 등록 한다.
$ sudo add-apt-repository 'deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran35/'
R 시작 할 때 매우 쉬운 ggplot2, dplyr 패키지 자동 로드
R 진입 하는 초보 사용자들은 항상 tidyvers를 실행 했다. tidyvers는 항상 아래와 같은 충돌(conflicts) 문제를 겪는데, 만약에 패키지를 잘 안다고 하면, tidyvers 를 실행 하지 않고, tidyvers에 import 된 패키지를 사용하면 된다.
tidyvers 안에 import 된 대표적인 패키지가 "ggplot2"와 "dplyr" 이다. 이것만 있으면 데이터 핸들링과 데이터 시각화 모든것을 할 수 있다.
그 동안 우리는 패키지를 로딩 할 때, 소스 코드 마다 아래와 같이 "ggplot2" 와 "dplyr"을 항상 로딩 시켰다.
library(dplyr)
library(ggplot2)
위와 같은 패키지를 소스 코드에 항상 로딩 할 필요가 없어 졌다.
아래와 같이 우분투(ubuntu)에 콘솔 환경 설정을 하고 자동으로 로딩 하면 된다.
Rprofile.site 에서 아래와 같은 명령어만 추가 하면 지동으로 시작 된다.
options(defaultPackages=c(getOption("defaultPackages"),"dplyr", "ggplot2" ))
아래와 같이 ggplot2와 dplyr을 별도의 패키지 로딩 없이 사용 할 수 있다.
R에서 1e+05 숫자들이 나온다면 환경 설정
R을 사용하면서 큰 숫자를 다룰 때, 1e+05 한 숫자들이 나와서 무슨 숫자인지 잘 모르는 경우가 있다. 일단 이런 것이 있으면, 당장 숫자를 알 수 없다. 여기에서 당장 처리 할 있는 것이 있다.
아래와 같이 2021년 1월에 새로 나온 패키지 "formattable"에서 확인 할 수 있다.
a 를 10십만 숫자를 넣는다. 그럼 아래와 같이 숫자가 나온다.
a <- 100000
a
## [1] 1e+05
알 수 없는 숫자가 나온다. 이것을 아래와 같이 숫자 천단위로 나눌 수 있다.
library(formattable)
comma(a, format = "d")
## [1] 100,000
그리고 놀랍게도 이것은 연산 까지 된다.
comma(a, format = "d") * 100
## [1] 10,000,000
콤마 없이 숫자를 나타낼 수 있다. option 함수를 이용하면 된다.
options(scipen = 3)
a
## [1] 100000
option 함수를 사용 할 수 있지만, .Rprofile에 작성 해서 시작 할 때 부 터 미리 설정 할 수 있다.
우분투 콘솔 에서 /usr/lib/R/etc 폴더에서 Rprofile.site 에서 위의 그림과 같이 options(scipen =3)을 추가 하면 1e+05 문자 들이 나오지 않는다.
R 환경 설정 파일 Renviron , Rprofile 한글 인코딩 설정시 사용
R 환경 설정 파일에서 반드시 쓸 일이 있다. 오라클 한글 인코딩 설정 할 때 꼭 필요 한데, 이 부분을 잘 몰라서, 우리 회사 서버 팀과 같이 서로 고생들만 하였다. 어찌 되었든 이 부분에 대한 개념은 매우 중요 하니, 아래와 같이 이야기 하겠다.
R에는 2종류의 환경 설정 파일이 있다.
- 라이브러리 저장할 곳 등의 환경 변수를 지정 하는 ''
- CRAN의 미러 사이트나 그래프 옵션 등을 R 코드로 지정한 'Rprofile'
Reviron의 저장 장소
오늘도 데이터 R 시작 페이지
css cheat sheet 클래스 선택자, margin(마진), display , center 조정 간단한 구성 요소
앞에서는 html의 간단한 sheet를 소개 하였습니다. html은 주로 골격을 나타나는 것이라, 디자인을 하는데는 css로 하여야 합니다. 아래 코드와 같이 css 관련 하여 매우 간단하게 코딩 하겠습니다. body 부분의 css 코딩 ...
-
통계학에서 베이블 분포(Weibull distribution)는 연속확률 분포로써 고장 확률에 대한 예측에 대하여 많이 쓰인다. 신뢰도를 측정하는데 많이 쓰이는데, 시스템 혹은 부품이 작동을 시작하여 그 시점까지 고장 나지 않고 여전히...
-
KoLNP 로딩하면 아래와 같은 메시지가 나올 경우가 있다. warning message: in i.p(...) : 패키지 ‘c:/users/rdmkyg/appdata/local/temp/rtmps6vlku/file23e45dd83537/konlp...
-
칼만 필터 Kalman filter는 충분히 성숙한 방법이다. 시계열로 부터 새로운 정보를 결합하는 데 사용되고 과거에 알려진 내부 상태 추정 정보를 지능적으로 결합해 준다. 칼만 필터의 최초 사용 사례로는 아폴로 11호 apollo 11 mis...
-
논리연산자 AND,OR는 실무에서 많이 쓰이는 방법이다. R을 처음 시작 하는 컴퓨터 프로그래머는 for문을 많이 사용한다. 하지만 R에서 for문은 속도 측면에서 최악이다. 그리고 AND, OR, IF 문도 for문을 돌리지 않고 dpl...
-
Rstudio 4.1.1 버전하고 Rstudio 2021.09.0의 계정 이름이 한글 일 때 아래와 같은 오류가 발생 한다. package ‘devtools’ successfully unpacked and MD5 sums checked The do...
-
predict를 이용한 예측은 현업 실무 할 때 매우 중요하다. 모델을 만들었는데, 그것을 예측하여, 결과값을 만들어 전사 DB에 업데이트 하였다. 회귀분석 Predict Observation trees 데이터 셋에 대해 다음의 문제를 해...
-
필자가 근무하고 있는 부서는 보전(maintenance Dept') 부서이다. 생존분석이 매우 중요하다. 고장확률은 아래와 같다. 고장확률 = 1 - 생존확를 센서에서 고장에 대한 Event 알람 신호를 받아,...
-
1. devtools 가 필요한 이유
-
현업에 있으면, 직면하는 데이터는 항상 범주형(카테고리) 데이터 셋이다. 다른 모델로 하였을 경우 범주형 데이터는 항상 원-핫 인코딩을 하여 계산 하여야 만 했다. 하지만, 원-핫 인코딩을 하지 않고, 범주형 데이터를 이용하는 것에 대...
-
딥러닝 손실 함수 사용할때, 약방의 감초처럼 나오는 엔트로피 함수, 이것을 모르면, 일단 딥러닝을 모른 다 할 정도로 엔트로피 함수는 중요 하다. 딥러닝에서는 손실값을 구할때 사용하는 것으로, 사실상 손실 값을 계산 하지 않으면, 실...