이번 포스팅에서는 저번 시간까지 배운 홀트-윈터스 계절 모형과는 다른 미래의 값을 예측하기 위한 방법인 ETS모델에 대해서 알아보고 또 다른 예측방법인 벤치마크 방법에 대해서 알아보려고 한다. 목차는 다음과 같다.
1. ETS 모델
2. 벤치마크 예측법
1. ETS 모델
ETS의 의미는 Error, Trend, Seasonal을 의미한다. 기본적으로 ETS 모델은 잔차(실제값-예측값) 즉, Error로 보정을 해주는 모델이다. ETS의 모델의 인자에 여러가지가 들어갈 수 있고 여러가지 모델을 만들 수 있다. 모델 종류에 대해서 알아보자. E,T,S각 인자에 맞게 들어갈 수 있는 유형이라고 생각하면 된다.
#N : None / A: Additive / M: Mulitiplicative
-
E(Error)
-
A : 가법 Error를 보정해준다.
-
M : 승법 Error를 보정해준다.
-
-
T(Trend) : 추세성분을 추정하고 나서 불규칙+계절 성분에 추세성분을 더할지 곱할지를 선택하는 것!
-
A : 추세성분(trend)을 더하겠다. 대부분의 경우 모두 A를 사용.
-
M : 추세성분을 곱하겠다.
-
-
S(Seasonal)
-
N : 계절성분 없음.
-
A : 계절성분을 더해주겠다.
-
M : 계절성분을 곱해주겠다.
-
-
ZZZ : ETS의 인자가 각 ZZZ인데, 이는 모델이 스스로 모델을 만들어주는 이른바 'auto system'이라고 보면 되겠다.)
-
참고로 ZZZ모델로 선정하다 보면 Trend인자에서 'Ad'인 모델을 발견할 수도 있는데 이는 "감쇠추세를 더하겠다"의 의미로 이해하면 된다.
-
위의 경우에서 모든 조합의 경우가 되는 건 아니다. 단적인 예로, 가법 Error를 보정(Error : A)해주면서 계절성분을 곱해주는(Seasonal : M) 모델을 만들게 되면 에러가 발생할 것이다.
그리고 가법 Error와 승법 Error 보정의 차이가 궁금할 수도 있는데, 결론은 차이가 없다. 왜냐하면 Error항들의 평균이 0이고 분산이 일정한 값으로 동일하다고 가정하기 때문이다.
위에서 본 것처럼 ETS모델에서도 여러가지 조합으로 이루어진 다양한 모델이 존재한다. 이러한 여러가지 모델 중에서 가장 최적의 모델을 선정하기 위해서는 AIC, AICC, BI라는 '정보손실량'을 나타내는 수치와 RMSE값으로 판단할 수 있다. 보통 정보손실량을 나타내는 수치가 작을수록 RMSE값이 낮아지는 경향을 보이므로 가장 RMSE값이 낮은 모델을 최적의 모델로 선정해도 된다.
2. 벤치마크 예측법
지금까지 살펴보았던 홀트선형, 홀트-윈터스, ETS모델 모두 미래의 값을 예측하기 위해 사용된다. 하지만 R의 'forecast'패키지에는 또 미래값을 단순예측하는 방법들이 있는데 이에 대해서 알아보자.
-
Average Method (meanf 함수) : 과거 시계열 자료들의 단순평균으로 예측
-
Naive Method (naive 함수) : 최근 데이터로 미래값을 예측. 즉, 주어진 데이터의 가장 마지막 데이터로 미래값을 동일하게 예측한다. 따라서 단순지수평활법 함수인 ses함수에서 alpha값이 1일때와 동일하다.
-
Seasonal naive Method (snaive 함수) : 이전 계절값들을 이용해서 예측
-
Drift(추세) Method (rwf 함수, drift인자에 TRUE/FALSE로 설정 가능)
-
drift=TRUE일 때, 시계열 데이터의 처음과 마지막 관찰값을 직선으로 연결
-
drift=FALSE일 때, Naive Method와 동일하다.
-
'Data Science > 시계열(Time-Series) 분석' 카테고리의 다른 글
AR(AutoRegressive), MA(Moving Average), ARMA Models (0) | 2020.07.14 |
---|---|
Box-Jenkins 방법론과 ARIMA 모델의 기초 (0) | 2020.07.14 |
시계열의 분해법(Time-series decomposition) (0) | 2020.05.28 |
시계열 데이터(Time-Series) 분석, 예측방법 (0) | 2020.04.30 |
시계열 데이터(Time-Series Data)의 특징과 모형 (0) | 2020.04.27 |