시계열&계량경제학

시계열 분석 #3 자기상관

seungbeomdo 2023. 2. 1. 18:26

1. 자기상관함수(ACF)

1.1. 자기상관함수

  • 자기상관(Auto Correlation)이란 시계열을 구성하는 확률변수들이 서로 상관되는 성질을 의미한다. 시계열의 자기상관을 측정할 때는 첫째, 시계열의 자기상관함수를 구하는 방법을 사용할 수 있다.
  • 자기상관은 time lag k에 대하여 정의한다. 시계열 $X_{t}$의  k차 자기상관함수 ACF는 다음과 같다.

$$\rho(k) = Corr(X_{t}, X_{t-k}) = \frac{Cov(X_{t}, X_{t-k})}{\sqrt{Var(X_{t})Var(X_{t-k})}}$$

  • 만약 시계열이 정상적이라면 $Var(Z_{t})= Var(Z_{t-k})$이 성립한다. 따라서 정상시계열의 자기상관함수는

$$\rho(k) = \frac{\gamma(k)}{\gamma(0)}$$

where $\gamma(k)$는 k차 자기공분산 $Cov(X_{t}, X_{t-k})$

  • 자기상관 함수의 값이 0이 아니라면 자기상관을 갖는 시계열이라고 말할 수 있다. 일반적으로 시계열은 자기상관을 갖는다. 

 

  • 삼성전자 주가 시계열의 자기상관함수를 그려보면 아래와 같다.
    • 주가 시계열은 시차 20까지(아마 그 이상에 대해서도) 양의 자기상관을 가진다.

  • 삼성전자 주가의 일별 수익률 시계열의 자기상관함수를 그려보면 아래와 같다.
    • 일별 주가수익률의 시계열은 자기상관이 거의 존재하지 않는다. 시차가 제로일 때는 당연히 자기상관이 1의 값을 가진다.

  • 자기상관함수 그래프를 통해서 시계열의 독립성과 정상성 여부를 간접적으로 확인해볼 수 있다.
    • 주가시계열은 자기상관이 항상 통계적으로 유의한 양의 값이므로 독립적이라고 할 수 없다. 반면 일별 수익률의 시계열은 자기상관이 1차 이상에 대해서는 아주 작으므로 독립성의 필요조건은 충족한다. 물론 상관계수가 제로인 것이 독립적임을 의미하지는 않으므로 독립적이라고 결론 지을 수는 없다.
    • 후에 다루겠지만 정상 시계열은 자기상관이 1차 이상에 대해서 빠르게 감소한다. 따라서 주가시계열은 정상적이라고 보기 힘든 반면 수익률 시계열은 정상적이라고 할 수 있다. 이는 그래프를 통해서도 짐작할 수 있다. 주가시계열은 시간에 대해서 평균과 증가하는 경향을 보이지만, 수익률은 그렇지 않다.

1.2. 자기상관 검정

  • 시계열이 자기상관을 가지는지를 검정하는 대표적인 방법은 Ljung-Box Test이다. Portmanteau Test라고도 부른다. 
  • Ljung-Boxt 검정의 직관적인 아이디어는 시계열의 시차 K까지의 자기상관계수가 모두 0이라는 것이다.

$$\rho(1) = \rho(2) = ... = \rho(K) = 0$$

  • 위의 수식은 곧 Ljung-Box 검정의 귀무가설이 된다. 주어진 귀무가설 하에서 다음의 검정통계량 $Q$는 자유도가 $K$인 카이제곱분포(Chi-Squre Distribution)으로 수렴한다(Asymptotically Distributed). 

$$ Q = n(n+2)\Sigma_{k=1}^{K}\frac{\rho_{k}^{2}}{n-k} \longrightarrow_{d} \mathcal{X}^{2}(K) $$

  • 비슷한 검정으로 Box-Pierce Test라는 것도 있다. 이것도 자기상관 여부를 확인하는 검정인데 Ljung-Box 검정과 거의 같다. 원래 Box-Pierce 검정이 자기상관을 검정하기 위해 먼저 제시되었으나 이후에 검정통계량을 살짝 수정한 Ljung-Box 검정이 쓰이는 것뿐이다. 굳이 쓰자면 Box-Pierce Test의 검정통계량은 다음과 같으며 귀무가설이 참일 때 자유도가 K인 카이제곱분포로 수렴한다.

$$ Q = n\Sigma_{k=1}^{K}\rho_{k}^{2} \longrightarrow_{d} \mathcal{X}^{2}(K) $$

  • 앞에서 보았던 삼성전자의 주가시계열과 일별 수익률 시계열에 대해 검정을 실시해보자. 최대 시차 K는 20으로 하였다. 결과는 둘 다 귀무가설을 기각했는데, 두 시계열 모두 자기상관을 갖는다는 뜻이다. 수익률 시계열은 독립적인 것처럼 보였는데, 아닌가보다. p-value가 조금 더 높게 나오긴 했다(별 의미없다). 


2. 편자기상관함수(PACF)

  • 시계열의 k차 자기상관을 구할 때, 그 사이에 있는 1차, 2차, ..., k-1차 값들의 영향을 배제하지 않았다. 그런데 이 중간에 있는 시점의 값들과의 상관이 k차 자기상관을 구할 때 영향을 미칠 수 있다. k차 편자기상관함수는 중간 시점의 값들의 영향력을 배제한 상태에서 구한 자기상관을 말한다. 다음과 같이 정의된다.

$$P(k) = Corr[X_{t}, X_{t-k}|X_{t-1}, X_{t-2}, ... , X_{t-k+1}]$$

  •  k차 편자기상관함수의 값은 다음 회귀모형에서 k차 lag값의 회귀계수 $\phi_{kk}$와 동일하다.

$$X_{t} = \phi_{k1}X_{t-1} + \phi_{k2}X_{t-2} + ... + \phi_{kk}X_{t-k} + \epsilon_{t}$$

where $\epsilon$ is the error term

  • 이는 회귀모형의 계수가 갖는 의미를 생각해보면 이해하기 쉽다. 회귀식에서 각 회귀계수는 다른 독립변수들이 불변할 때, 해당하는 독립변수가 변화했을 때 종속변수에 미치는 영향이다. 즉 다른 시차의 값들이 불변할 때 해당 시차의 값의 영향력을 보여준다.
    • 위 회귀모형은 나중에 다룰 AR 회귀모형과도 같다.

 

  • 한편 1차 편자기상관함수의 경우 중간 시점의 값이 존재하지 않으므로, 1차 자기상관과 동일하다.