이번 포스팅에서는 자기회귀 모형인 AR, 이동평균 모형인 MA, 이 두개를 합친 ARMA모형에 대해서 알아보려고 한다. 목차는 다음과 같다.
1. 모형식별을 위한 Correlogram
2. AR 모형
3. MA 모형
4. ARMA 모형
1. 모형식별을 위한 Correlogram
ACF, PACF 함수 형태를 보고 모형을 식별할 때 사용하는 유용한 Correlogram이 있다. 이 표는 시차 k가 달라짐에 따라 ACF, PACF 함수값이 어떻게 달라지는지를 나타낸 것이며 한국어로는 자기상관성도표라고 부른다.
2. AR 모형
AR 모형은 자기회귀(AutoRegressive)모형이다. AR 모형에 적합한 시계열 데이터의 ACF, PACF 함수 그래프 형태는 위 Correlogram 도표에서 빨간색 네모칸 쳐진 부분에 해당한다. 빨간색 네모칸 부분을 보면 원 데이터의 PACF 함수에서 저렇게 튀어나온 막대 개수에 따라 AR의 차수를 보통 정한다. 따라서 위의 경우와 같다면 AR모형의 차수가 1이 적당할 것이며 ARIMA 모델로 나타낸다면 ARIMA(1,0,0)이 될 것이다.
위 그림은 AR모형의 일반화된 수식이다. AR은 끝에 εt라는 Random한 값이 붙는 것이 특징이다. 또한 AR 모형에서 계수값이 일정한 조건을 만족해야 정상성을 만족하는데, 그 제약조건은 다음과 같다.
3. MA 모형
MA 모형에 적합한 ACF, PACF 함수 형태는 AR모형에서의 ACF, PACF 함수 형태를 서로 바꾼 형태이다. 따라서 MA모형에서 차수는 ACF 그래프의 파란색 선을 훌쩍 넘어 튀어나온 막대 그래프의 개수가 된다. 그리고 MA 모형은 시점 t의 y가 예측오차(ε)의 가중이동평균이다. 즉 수식은 다음과 같아진다.
4. ARMA 모형
ARMA 모형은 AR + MA 모형이라고 생각하면 된다. ARMA 모형에 적합한 시계열 데이터의 ACF, PACF 함수 형태는 AR 형태에서의 ACF함수 형태와 MA 형태에서의 PACF 함수 형태를 각각 갖고와서 모양을 띄게 된다. 따라서 ACF, PACF 함수 둘 다 지수함수 감소 형태를 띈다. 따라서 ARMA의 차수를 정하기 위해서는 AR은 PACF 함수에서 파란선을 튀어나온 막대 개수, MA는 ACF 함수에서 파란선을 튀어나온 막대 개수에 따라 결정하면 된다.
그리고 ARMA 모형은 Backward shift operator라는 후진연산자 'B'를 사용하게 되는 이는 보통 lag값이라고 부르기도 한다. ARMA의 수학적 수식은 다음과 같다.
'Data Science > 시계열(Time-Series) 분석' 카테고리의 다른 글
ARMIA and SARIMA Models (0) | 2020.07.15 |
---|---|
Box-Jenkins 방법론과 ARIMA 모델의 기초 (0) | 2020.07.14 |
시계열의 분해법(Time-series decomposition) (0) | 2020.05.28 |
ETS 모델과 벤치마크로 미래의 값 예측하기 (0) | 2020.05.28 |
시계열 데이터(Time-Series) 분석, 예측방법 (0) | 2020.04.30 |