dplyr %>% 파이프 연산자 부분 집합 및 필터 filter 는 데이터 셋 가져오면 가장 많이 사용하는 기능 이다. 부동산의 데이터면 내가 궁금해 하던 지역의 아파트 가격을 알 수가 있다. 어찌 보면 dplyr 에서 가장 많이 쓰는 기능 중에 하나 이다.
dplyr 설치 및 설정은 아래와 같은 페이지를 보면 알 수 있다.
https://rdmkyg.blogspot.com/2021/12/dplyr-tidyr-ubuntu-r-41.html
dplyr %>% 파이프 연산자 부분 집합 및 필터 filter 는 데이터 셋 가져오면 가장 많이 사용하는 기능 이다. 부동산의 데이터면 내가 궁금해 하던 지역의 아파트 가격을 알 수가 있다. 어찌 보면 dplyr 에서 가장 많이 쓰는 기능 중에 하나 이다.
dplyr 설치 및 설정은 아래와 같은 페이지를 보면 알 수 있다.
https://rdmkyg.blogspot.com/2021/12/dplyr-tidyr-ubuntu-r-41.html
R에서 가장 많이 사용하고 있는 패키지이다. 잘 사용하면 엑셀 보다 더 좋은 패키지이다.
dplyr은 주로 집계 쪽에 많이 사용하고 tidyr 은 데이터 모형을 변경 하는데 많이 사용한다.
실제 업무에 있어서 엑셀을 대체 할 정도로 많이 사용하는 패키지이다. 이것에 대한 예제를 가지고 이야기 하겠다. 물론 예제는 아래에 있는 Cheat Sheet 기반으로 작성 하였다.
https://www.rstudio.com/wp-content/uploads/2015/02/data-wrangling-cheatsheet.pdf
python list 와 R vector는 유사점이 많다. 하지만 매우 같은 것이 아니다.
같은 부분이 있다면, 요소를 추가, 삭제, 가능 하다는 정도이고, 다르다면, Python list는 중괄호 []를 선택 하고 R vector는 소괄호()를 선택 해야 한다는 다른 점이 있다.
그럼 아래와 같이 파이썬의 리스트 사항부터 보자.
>>>names = ['a', 'b', 'c']
>>># 리스트에서 추출하기
>>>names[0]
'a'
>>>names[1]
'b'
>>>#리스트 추가하기
>>>names.append("d")
>>>names
['a', 'b', 'c', 'd']
>>>#리스트 인덱싱하기
R에서 데이터를 가져올때, 파일 다운로드 방식으로 가져온다. 물론 개인적으로 Owncloud라고 별도의 클라우드를 가지고 있으나, 개인적으로 사용하려면, 안정적인 서버가 있어야 하고, 이것 또한 이중화 되어 있어야 한다.
나는 서버 전문가가 아니므로, 내가 설치한 서버가 언제까지 존재 할지는 알 수 없다. Owncloud에서는 URL에서 다운로드 하는 것이 정해져 있는데, 구글 드라이브에서는 URL에서 다운로드 하는 것을 어렵게 한다.
네이저 지식인에 이 이렇게 질문이 왔다.
코딩 문제를 풀어야 하는데.. 식을 어떻게 해야할지 몰라서요...ㅠㅠㅠㅠㅠ
문제가.. 저녁 10시 이전에는 시간당 만원이고
저녁 10시를 초과하면 시간당 만오천원으로 지급하는 경우 근무시간 입력받으면 출력으로 임금이 계산되도록 하라는 문제인데..... 너무 어려워요.ㅠㅠㅠㅠㅠㅠ
숙제인데.... 무슨말인지 모르겠어요.ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ
제발 제발 설명이랑 어떻게 풀어야할까요?ㅠㅠㅠㅠㅠㅠㅠㅠ
R실무를 하면서, 문자열, paste, nchar, substr, strsplit, grep 및 정규화 표현식은 많이 사용되어 진다. 아래와 같이 위 함수를 정의한다.
만약에 위의 명령어를 사용하지 못한 다면, R의 데이터 전처리 할때, 어떻게 해야 할지 몰라, 그냥 엑셀에서 전처리를 전부 하고, R에서는 모델링을 하게 된다. 어떠한 책을 보더라도, 이 부분이 있다는 것을 설명 할 뿐 어떻게 사용하는지 알 수 없다.
R vector 사용법 |
앞에서는 html의 간단한 sheet를 소개 하였습니다. html은 주로 골격을 나타나는 것이라, 디자인을 하는데는 css로 하여야 합니다. 아래 코드와 같이 css 관련 하여 매우 간단하게 코딩 하겠습니다. body 부분의 css 코딩 ...