시계열 데이터에서 state(상태) 나타내는 것을 은닉마르코프 모형이다. 은닉 마르코프 모형에서 어느 시점에서 구입해서, 어느 시점에서 판매하는 것이 가장 좋은 것인지, 판단 하려면, 그래프를 이용한 EDA를 하여야 한다.
state별로 데이터의 분포로 보는 것은 매우 중요하다. 특히, 많은 금액을 투자 한다면, 더욱 많이 봐야 한다. 즉 투자 비용이 크면 클 수록 많이 봐야 한다는 것이다.
시계열 데이터에서 state(상태) 나타내는 것을 은닉마르코프 모형이다. 은닉 마르코프 모형에서 어느 시점에서 구입해서, 어느 시점에서 판매하는 것이 가장 좋은 것인지, 판단 하려면, 그래프를 이용한 EDA를 하여야 한다.
state별로 데이터의 분포로 보는 것은 매우 중요하다. 특히, 많은 금액을 투자 한다면, 더욱 많이 봐야 한다. 즉 투자 비용이 크면 클 수록 많이 봐야 한다는 것이다.
역시 ggplot2는 다른 툴에 비해서 매우 뛰어난 시각화 기능을 가지고 있다. 실제 실무 사례에서도 많이 쓰일 수 있는 데이터 셋과 그래프로 구성 되어 있다.
글을 쓰고 있는 나도, 예전에 사내 주유소 시스템 만들어서 요일별, 시간 대별 주유 횟수를 그려, 그래프를 개발자에게 그려 달라고 하여, 기능을 사용하였다. 그 때 당시에는 굉장히 신기 했는데, 지금 ggplot2에서는 데이터만 있으면 아주 쉽게 이용 할 수 있다.
| 뉴욕 택시 데이터 셋 ggplot2 |
아래는 UCSanDiego 분석한 뉴욕 택시 자습서(New York Taxi cabs) 그래프 그리는 것이다.
이것은 쉽게 설명 하려고, 스크립트 코드를 길고 자세 하게 구성 하였다.
지금 상황이 아비 규환이다. 어느 부서든 회사가 인수 합병되고 나서 투자를 기획하는 경영기획이 특히 않이 정신이 없고, 우리부서도 전부 미국 필리 조선소로 인원이 나가 있어, 사실상 10년 이상 고기량자는 거의 없다. 우리부서에 남아...