본문 바로가기

Data Science/시계열(Time-Series) 분석

ETS 모델과 벤치마크로 미래의 값 예측하기

반응형

이번 포스팅에서는 저번 시간까지 배운 홀트-윈터스 계절 모형과는 다른 미래의 값을 예측하기 위한 방법인 ETS모델에 대해서 알아보고 또 다른 예측방법인 벤치마크 방법에 대해서 알아보려고 한다. 목차는 다음과 같다.

 

1. ETS 모델

2. 벤치마크 예측법

 

1. ETS 모델

ETS의 의미는 Error, Trend, Seasonal을 의미한다. 기본적으로 ETS 모델은 잔차(실제값-예측값) 즉, Error로 보정을 해주는 모델이다. ETS의 모델의 인자에 여러가지가 들어갈 수 있고 여러가지 모델을 만들 수 있다. 모델 종류에 대해서 알아보자. E,T,S각 인자에 맞게 들어갈 수 있는 유형이라고 생각하면 된다.

 

ETS모댈의 모델링 조합

 

#N : None / A: Additive / M: Mulitiplicative   

  • E(Error) 

    1. A : 가법 Error를 보정해준다.

    2. M : 승법 Error를 보정해준다.

  • T(Trend) : 추세성분을 추정하고 나서 불규칙+계절 성분에 추세성분을 더할지 곱할지를 선택하는 것!

    1. A : 추세성분(trend)을 더하겠다. 대부분의 경우 모두 A를 사용.

    2. M : 추세성분을 곱하겠다.

  • S(Seasonal)

    1. N : 계절성분  없음.

    2. A : 계절성분을 더해주겠다.

    3. M : 계절성분을 곱해주겠다.

  • ZZZ : ETS의 인자가 각 ZZZ인데, 이는 모델이 스스로 모델을 만들어주는 이른바 'auto system'이라고 보면 되겠다.)

    • 참고로 ZZZ모델로 선정하다 보면 Trend인자에서 'Ad'인 모델을 발견할 수도 있는데 이는 "감쇠추세를 더하겠다"의 의미로 이해하면 된다.

위의 경우에서 모든 조합의 경우가 되는 건 아니다. 단적인 예로, 가법 Error를 보정(Error : A)해주면서 계절성분을 곱해주는(Seasonal : M) 모델을 만들게 되면 에러가 발생할 것이다. 

 

그리고 가법 Error와 승법 Error 보정의 차이가 궁금할 수도 있는데, 결론은 차이가 없다. 왜냐하면 Error항들의 평균이 0이고 분산이 일정한 값으로 동일하다고 가정하기 때문이다.

 

위에서 본 것처럼 ETS모델에서도 여러가지 조합으로 이루어진 다양한 모델이 존재한다. 이러한 여러가지 모델 중에서 가장 최적의 모델을 선정하기 위해서는 AIC, AICC, BI라는 '정보손실량'을 나타내는 수치와 RMSE값으로 판단할 수 있다. 보통 정보손실량을 나타내는 수치가 작을수록 RMSE값이 낮아지는 경향을 보이므로 가장 RMSE값이 낮은 모델을 최적의 모델로 선정해도 된다.

 

(예시)ETS모델링을 통한 미래값 예측 그래프 

 

 

2. 벤치마크 예측법 

지금까지 살펴보았던 홀트선형, 홀트-윈터스, ETS모델 모두 미래의 값을 예측하기 위해 사용된다. 하지만 R의 'forecast'패키지에는 또 미래값을 단순예측하는 방법들이 있는데 이에 대해서 알아보자. 

 

  • Average Method (meanf 함수) : 과거 시계열 자료들의 단순평균으로 예측

  • Naive Method (naive 함수) : 최근 데이터로 미래값을 예측. 즉, 주어진 데이터의 가장 마지막 데이터로 미래값을 동일하게 예측한다. 따라서 단순지수평활법 함수인 ses함수에서 alpha값이 1일때와 동일하다.

  • Seasonal naive Method (snaive 함수) : 이전 계절값들을 이용해서 예측

  • Drift(추세) Method (rwf 함수, drift인자에 TRUE/FALSE로 설정 가능)

    1. drift=TRUE일 때, 시계열 데이터의 처음과 마지막 관찰값을 직선으로 연결

    2. drift=FALSE일 때, Naive Method와 동일하다. 

(예시)snavie 함수를 사용해 미래값 예측하는 그래프

 

반응형