시계열 분석 실전 사례 은닉 마르코프 HMM 모형 주식 분석 3편 [state 별 그래프 분석]

   시계열 데이터에서  state(상태) 나타내는 것을 은닉마르코프 모형이다.  은닉 마르코프 모형에서 어느 시점에서 구입해서,  어느 시점에서 판매하는 것이 가장 좋은 것인지, 판단 하려면, 그래프를 이용한 EDA를 하여야 한다.   

  

   state별로 데이터의 분포로 보는 것은  매우 중요하다.   특히,  많은 금액을 투자 한다면,  더욱 많이 봐야 한다.  즉 투자 비용이 크면 클 수록 많이 봐야 한다는 것이다. 

 

   아래의 소스크드를 실행 시키려면,  아래의 페이지에 접속에서 소스 코드를 미리 돌려 봐야 한다. 

   https://rdmkyg.blogspot.com/2021/09/hmm-1.html

   https://rdmkyg.blogspot.com/2021/09/hmm-2.html


 HMM에서 state별로 데이터를 보려면,  히스토그램을 봐야 한다.   어떤 상태가 많이 겹쳤는지 봐야 하기 때문이다.    이번 편에서는 조건부 확률을 고려 하지 않고,  그래프를 그릴 것이다. 

# state 별 히스토그램 보기 
  df %>% 
    ggplot(aes(adjusted)) +
    geom_histogram() +
    facet_wrap(~state, nrow = 2)

HMM state 별 히스토그램


state 별로 히스코그램을 직관적으로 보면,  상태 3번 state에서 구매해서,  5번 state에서 판매해야 한다는 결론에 도달한다.   히스토그램을 각 구간별로 횟수를 count 하기 때문에, count가 많은 구간을 봐야 한다.    물론 2번과 3번 state는 매우 흡사하다.  어찌 되었든 25,000원대의 일자가 많다는 것이 사실이다.   

  주식은 심리적인 싸움인다.  그러니까?   state 1,2,3번 대,  즉  2번 대 구입을 해서,  다시 판매를 기다리기에는  매일 매일  주식 시세만 바라보고 사는 사람에게는  기다리기가 매우 어렵다.  마치 이 주식이 횡보하여,  보합세를 간다는 생각이 많이 들것이다.   이 기간을 참지 못하고 팔면,  세금과 수수료만 지불하게 되고,  이익은 많이 챙기지 못한다. 

 그리고  state 5번 대에 걸처 있는 일자가 많지 않다.  즉   28,000원 구간이 그 다지 많지 않다는 것이다.  마치 낚시하는 사람이 입질이 왔을때,  채간다는 느낌이다. 


아래와 같은 그래프를 보았을때는 판매할 수 있는 기간이 많다고 하지만 타이밍을 잡기 어렵다.  

HMM state 그래프

5번대에 있으면,  앞으로 계속 오를 것과 같은 느낌을 같는 것은 사람의 심리이다.  그래서 주식 거래에서는 데이터를 보고 본인이 생각하는 원칙을 정해야 한다. 


아래의 확률 밀도 함수를 보아도 위의 설명이 명확해 진다.   state 2가 제일 많고, 그 다음 state 3 가 그 다음으로 많다.    

# 확률밀도 함수 별 state 보기 
  df %>%
    mutate(state = as.factor(state)) %>% 
    ggplot(mapping = aes(x = adjusted, y = ..density..)) +
    geom_freqpoly(mapping = aes(color = state))

HMM 은닉 마르코프모형 state 밀도 함수

기다림의 미학이 매우 중요하다는 것이 얼마나 중요하다는 것인지 알 수 있다.   

 데이터 state 별  그룹핑하여,  색으로 나누어  히스토그램을 보면,  state 별로 금액이 많이 겹쳐 있는 구간을 볼 수 있다.   하지만,  구간의 경계는 직관적으로 어느 정도 인지 짐작 할 수 있다.   

HMM 은닉 마르코프 겹침 히스토그램

  그런데,  이것을 보았을 때,  30,000원을 훌쩍 넘기는 아웃라이어가 존재 한다.  이것에 대한 전체 히스토그램은 정규분포에 수렴 하지 않지만,  하지만,   그 아웃라이어가  그다지 큰 충격을 주지는 못했다.   큰 충격을 주려면  적어도,  30% 이상   40,000원 정도의 범위로 떨어져 있어야 하기 때문이다.   

하지만,  많은 사람들은 5번 구간에 돌입 하였을때,  앞으로 더 많이 오를 것이라고 판단하고, 계속 가지고 있으려 하지만,  재차 반복하지만,  그 시간은 길지 않다.

대부분의 사람들의  금액과 변동률만 보지 시간을 보지 못한다.    너무 더디 넘어가는 시간을 너무 참지 못한다.   

하지만 중요한 것은  본인이 주식을 팔지 않는 이상 수익이나,  손실이 났다고 할 수 없다.   

그냥  한 세월 기다리다가,  한번 기회가 오면 팔고 빠지고,  다시 기회가 오면,  씨앗을 뿌리며 기다리는 것이 제일 좋다. 

댓글 없음:

댓글 쓰기

css cheat sheet 클래스 선택자, margin(마진), display , center 조정 간단한 구성 요소

 앞에서는 html의 간단한 sheet를 소개 하였습니다.   html은  주로 골격을 나타나는 것이라, 디자인을 하는데는 css로 하여야 합니다.  아래 코드와 같이 css 관련 하여 매우 간단하게 코딩 하겠습니다.  body 부분의 css 코딩  ...