시계열 데이터를 위해 개발된 다양한 통계모델이 있다. ARIMA 모델을 확장 하거나, ARIMA 모델과 다른 역동성을 가정하기도 한다. 이번에는 그중 가장 일반적으로 사용되고 잘 알려진 통계적 시계열 모델을 간략히 살펴 보겠다.
통계 모형의 변형 |
계절성 ARIMA
계절성 ARIMA(SARIMA) 모델은 승법 multiplicative 계절성을 가정 한다. 따라서 SARIMA 모델은 ARIMA(p,d,q) × (P, D, Q)m과 같이 표현된다. 계절적 행동 자체를 상정하는 SARIMA 모델은 계절 주기당 시간 단계의 수를 정하는 m을 가진 ARIMA 과정이라고 볼 수도 있다. 이 인수의 중요한 점은 모델이 시간상 인접한 데이터가 동일한 계절 또는 서로 다른 계절에 있어도 시간적으로 근접한 일반적인 방법으로 서로 영향을 인식한다는 것이다.
계절적 효과를 다뤄야 하므로 ARIMA 모델보다 SARIMA를 식별하는 것이 더 까다롭다. 다행히 forecast 패키지의 auto.arima()는 일반적인 ARIMA의 추정 작업처럼 이문제를 다룰 수 있다. 알서 설명 했듯이, 자동화된 방식의 선택을 대체할 만한 지식을 충분히 갖추지 않았다면 자동화된 파라미터의 선택 방법을 활용하는 것이 좋다.
ARCH, GARCH 및 그 외의 유사 종류
ARCH는 자귀회귀 조건부 이분산성 autoregressive conditional heteroskedasticity의 약어이다. 이 모델은 거의 금융 업계어서만 사용된다. 시계열 과목에서 종종 다뤄지므로 잠시 이모델에 대해 언급 하고 넘어 가겠다. 이러한 종류의 모델은 주가가 일정한 분산을 갖지 않으며, 분산이 이전의 분산들에 대한 조건부 자기 회귀성을 띈다는 관측에 기반 한다. (예를 들어 증권 거래소의 변동이 심한날은 클러스터로 표시된다.). 이러한 모델에서는 과정의 분산이 과정 자체보다는 자기회귀 과정으로 모델링 된다.
계층적 시계열 모델
계층적 시계열은 실세계에서 꽤 흔하지만, 많이 드러나지 않는다. 다음은 계층적 시계열이 발생하는 일부 상황을 나열 한다.
- 회사 제품의 월별 총 수요는 SKU 번호로 세분화 된다.
- 전체 유권자의 주간 정치 여론조사는 여성/남성 또는 히스패닉/아프리카계 미국인과 같은 인구통계 demographics(중복도 가능) 별로 센분화 된다.
- EU를 방문하는 일일 총 관광객 수를 EU의 각 회원국을 방문한 관광객 수로 세분화 한다.
R의 hts 패키지는 계층적 시계열을 다루는 편리한 방법을 제공한다. 이 패키지는 계층적 시계열 데이터를 시각화 하고 이러한 데이터에 대한 예측을 수행하는 데 모두 사용된다.
hts 패키지는 지금까지 등장한 다양한 방법론이 구현되어 있으며, 이들을 통해 예측을 수행한다.
- 계층적으로 가장 저수준의 여러 가지 예측을 한 다음(가장 세분화된), 이를 집계하여 고수준의 예측을 수행 한다.
- 가장 고수준의 예측을 한 다음, 기록된 집계요소의 비율을 기반으로 저수준의 예측을 수행 한다. 이 방법론은 저수준 예측에서 정확도가 떨어지는 경향이 보이지만, 시간에 따른 집계 비율의 변화를 예측하는 다양한 기법을 함께 사용하면 그 정도를 완화할 수 있다.
- 위의 두 방법의 장점을 취해서 중간 수준의 예측을 수행하는 '중간적' 접근법을 선택할 수 있습니다. (여러 계층이 있다는 가정). 그 다음 일반적으로 그 지점 위, 아래로 전파되면서 다른 수준의 예측을 이어서 수행한다.
궁극적으로 hts 패키지의 동작 방식은 모든 수준에 대한 예측이 서로 독립적으로 수행하는 것 이다. 그 다음 hts 하이드먼 방법과 일관성을 보장하기 위해 각 예측들을 결합한다.
이번 장에서 논의한 여러 통계 모델은 시계의 계층 수준에 상관없이 적용 될 수 있다. 계측정이라는 것은 행심이 되는 모델을 감싸는 래퍼 역항을 한다.
# 참고 : 실적 시계열 분석 - 한빛 미디어
댓글 없음:
댓글 쓰기