시계열 예측을 할 만한 데이터들은 매우 많다. 하지만, 시계열 예측은 어느 용도가 가장 좋냐면, 추세가 어느 방향으로 흘러 가는가에 대한 인사이트이다. 즉 이것은 계속 상향 하는 것이냐, 아니면, 평활 한 것이냐, 아니면 하향하는 것이냐, 계절성을 띄고 있느냐가 매우 중요하다.
어찌 되었든 과거 실적이 15개 이상이면, 시계열 예측이 가능 하다, 회사에서는 소모성 자재에 대해서 예측을 진행 하였지만, 일상 생활에서는 매우 많다. 즉 우리나라 경제 지표 그리고, 주가 지표, 어짜피 과거를 참고 하여, 미래를 예측 하는 것인데, 언제 까지나 과거의 영광이 그대로 재현 될지는 전혀 모른다.
하지만, 다른 방식으로 생각 하면, 무거운 무게 추는 그 방향이 쉽게 바뀌지도 않으며, 바뀔대, 속도가 느려져가면서 바뀌기 시작 한다. 이런 생각을 가지고 있다면, 우리가 자산 관리 할때 어느정도의 포토폴리오를 구성 할 수 있다.
예측은 어느 것보다 잘 정리 되어 있는 아래와 같은 교과서가 있다.
Monash University의 통계학 교수인 Rob J Hyndman 이 정리 하였는데, 코드와 내용이 매우 정리가 잘되었다. 필자도 이것을 보고 실무에 적용 하였다. 아래 그림을 클릭 하면 내용을 볼 수 있다.
Monash University의 통계학 교수인 Rob J Hyndman 이 정리 하였는데, 코드와 내용이 매우 정리가 잘되었다. 필자도 이것을 보고 실무에 적용 하였다. 아래 그림을 클릭 하면 내용을 볼 수 있다.
forecast는 R 버전 3.02 이상에 작동되며 , 아래와 같은 패키지도 내장되어 있다.
- 그래프 관련 패키지 : colorspace(컬러 파렛트) , ggplot2(가장 유명한 패키지), graphics
- 뉴럴넷 패키지 : nnet( Feed-Forward Neural Networks and Multinomial Log-Linear Models)
- 병렬 프로세싱 : parallel
- 시계열 연산 : imtest(선형 테스트),timeDate, tseries, urca, zoo
- 개발툴 : magritter( 파이프 연산자 %>%) , Rcpp(C++&R)
내장되어 있는 패키지가 많은 만큼 계산도 빨리 되고, 그래프 표현도 잘된다. 아래와 같이 설치 하면 되는데, 이것은 서버를 맨 처음 설치 할 때, 해야 한다. 서버 한참 운영 후에 설치하면 의존성 에러가 나는데, 무언인지 모를 수 있다.
위와 같이 내장되어 있는 패키지가 많으므로, 시간도 많이 걸린다. 충돌도 잘되고..
> install.packages('forecast', dependencies = TRUE)
의존성 체크에서 TRUE 하였을때 만 설치 된다. 그 만큼 충돌이 많았다는 이야기이다.
댓글 없음:
댓글 쓰기