시계열 분석 시계열의 상태 공간 모델

상태 공간 모델은 '실세계'에서 얻는 동기에 영향을 받는다.  추정시 측정 오류를 고려하는 방법, 사전 지식이나 믿음을 추정에 주입하는 방법처럼 실제 공학 문제에서 발생 있는 문제 들을 해결 한다. 

상태공간 모델에서 참 상태 true state를 직접 측정할 수 없으며  오직 측정된 것으로 부터 추론 하는 것만 가능 하다.   또한 상태공간 모델은 시스템에 적용된 내부 역동성 및 외부 압력에 의해 시간에 따라 변하는 참 상태의 진화 방식의 구체적인 시스템 역동성에 의존 한다. 

수학적 맥락에서 상태공간 모델을 접해 본 적이 없더라도 우리도 모르게 이미 일상생활에서 사용했을 가능성이 크다.   예를 들어 공격적으로 차선 변경을 시도하는 운전자를 발견했다고, 상상 해보자.  그때 그 운전자가 어느 차선으로 진로를 변경하는지 추측하려고 할 것이다.  그래야 충돌 사고가 일어나지 않고 자신을 보호 할 수 있다.  그 운전자가 음주 운전자라면,  경찰에 신고하여야 하며,  반면 운전자가 잠시 집중력을 잃었던것 뿐이고 난폭 운전을 다시 하지 않는다면,  더는 신경 쓰지 않아도 된다는 결론을 내린다. 

어떤 행동을 해야 하는지에 대한 결정을 내리기 전에 수 초 또는 수분 간의 관찰을 통해 해당 운전에 대한 상태공간 모델을 갱신하는 것이다. 

  우주로 발사된 로켓을 전형적인 예로 들수 있다.  뉴턴의 법칙을 알고 있기 때문에 시스템의 역동성 및 시간에 따른 움직임의 변화 규칙을 작성 할 수 있다.  그리고 위치 추적을 위한 GPS등 여러 센서에서 측정 오류가 발생할 수도 있으므로 이를 수치화 하고 계산의 불확실성을 고려하는 노력도 필요하다.  

마지막으로 로켓에 작용하는 세상의 모든 힘을 고려하는 것은 불가능 하다는 것을 알고 있다. 하지만 지상풍이나 태양풍처럼 알 수 없는 노이즈에서도 과정을 만들어야 한다.  지난 50년 동안 통계와 엔지니어링이 이러한 종류의 상황을 다루는 데 꽤 유용하다는 사실이 증명되었다. 


  두 가지 역사적인 동향은 상태공간 모델이 풀고자 하는 문제와 상태공간 모델의 발전에  영향을 끼쳤다. 

     첫째 20세기 중반에 기계자동화 시대로 접어 들었다.  그 당시 로켓, 우주선, 잠수함의 항법 시스템등 자동화된 발명품들은  측정이 불가능한 시스템 상태를 추정해야만 했다.  연구원들은 시스템 상태의 추정 방법을 연구 했고, 그 결과 상태 공간이라는 방법을 개발하기 시작 하였다. 

 당시 이 방법은 시스템의 다른 불확실성으로 부터 측정 오차를 명확하게 하려는 것을 가장 중요하게 여겼다.  이런 노력은 상태공간 방법의 첫 번째 사용을 이끌어 낼 수 있었다. 

이 기간 동안,  기록 기술과 이와 관련된 계산 기술도 함께 발전 했다.  그러면서 대규모 시계열 데이터셋이 만들어지게 되었고, 긴 시간에 걸쳐 세세하게 기록된 시계열 데이터셋을 얻을 수 있게 되었다.  더 많은 시계열 데이터를 사용할 수 있게 되면서 상태공간 모델링의 개념에 데이터 집약적인 방법들이 접목되어 발전될 수 있었다. 

  일반적으로 사용되는 상태공간 방법들

  • 선형 가우스 linear Gaussian 모델에 적용된 칼만 필터 Kalman filter
  • 은닉 마르코프 모형 hidden Markov model
  • 베이스 구조적 시계열 Bayesian structural time series
 각 방법에 대한 모델은 이미 잘 구현 되어 있어서 접근하기 쉽다.  각 모델에 대한 수학적인 직관력을 키우고,  어떤 데이터가 적합한지에 대한 내용을 살펴볼 것이다.  또 각 방법에 대한 실제 코드 예제도 함께 살펴 보자. 

각 방법에서 관측과 관측이 만들어낸 생태를 구분해 볼 것이다.  이 때 관측에 기반한 근본 상태를 추정하는 작업은 다음과 같이 여러 단계나 범누로 나눌 수 있다. 
  • 필터링 : 시간 t의 상태에 대한 추정 갱신에 시간 t의 측정 사용
  • 예측 : 시간 t의 예상되는 상태에 대한 예측 생성에 시간 t-1의 측정을 사용 (시간 t의 예상 되는 측정의 추론도 가능)
  • 평활화 : 시간 t의 참 상태 추정에  시간 t 및 t의 전후 측정 사용
유사해 보이는 이 작업들의 차이를 구분하는 것이 중요하다.  우선 필터링은 상태에 대한 추정의 갱신에 가장 최근 정보에 가중치를 주는 방법이다.  그리고 예측은 미래에 대한 어떠한 정보도 없이 미래 상태를 예측 한다.  마지막으로, 평활화는 미래와 과거 정보 모두 사용해서 특정 시간에서의 상태를 가장 잘 추정 한다. 

# 참고서적 : 실전 시계열 분석 - 한빛 미디어 


댓글 없음:

댓글 쓰기

css cheat sheet 클래스 선택자, margin(마진), display , center 조정 간단한 구성 요소

 앞에서는 html의 간단한 sheet를 소개 하였습니다.   html은  주로 골격을 나타나는 것이라, 디자인을 하는데는 css로 하여야 합니다.  아래 코드와 같이 css 관련 하여 매우 간단하게 코딩 하겠습니다.  body 부분의 css 코딩  ...