시계열&계량경제학

계량경제학 #9 자기상관 하에서의 선형회귀 모형 (2): HAC 추정량과 GLS

seungbeomdo 2023. 6. 4. 21:00

4. 오차항이 시계열적 상관을 가지는 경우

 

  • 데이터셋이 시계열 상관을 가질 때, 오차항도 마찬가지로 시계열 상관을 갖는다고 하자.

 

  • 이 경우에도 여전히 OLS 추정량은 Consistency를 만족한다. 이 시리즈에서 계속 얘기하듯이, 독립변수가 내생적이지만 않으면, OLS 추정량에는 그렇게 치명적인 문제(비일치성)는 없다.

$$\hat{\beta}_{n} \rightarrow^{a.s.} \beta _{*}$$

  • 다만 OLS 추정량의 Asymptotic 분포를 구하기 위해서 추정량의 분산을 다르게 정의한다.

$$\sqrt{n}(\hat{\beta}_{n} - \beta_{*}) \sim ^{A} N(0, E[\mathsf{X}_{t} \mathsf{X}_{t}^{T}]^{-1}BE[\mathsf{X}_{t} \mathsf{X}_{t}^{T}]^{-1})$$

 

  • 오차항이 MDS인 경우에는 분산식에서

$$B = E[U_{t}^{2}\mathsf{X}_{t} \mathsf{X}_{t}^{T}]$$

 

  • 반면 오차항이 시계열 상관을 가지는 경우

$$B = \lim_{n \rightarrow \infty} \frac{1}{n} \Sigma_{t=1}^{n} \Sigma_{\tau = 1}^{n}E[U_{t}U_{\tau}\mathsf{X}_{t} \mathsf{X}_{\tau}^{T}]$$

 

  • 사실 두 공식은 동일하다. 오차항이 시계열 상관을 가질 때의 B의 식을 전개해보면

$$B = E[U_{t}^{2}\mathsf{X}_{t} \mathsf{X}_{t}^{T}] + \lim_{n \rightarrow \infty} \frac{1}{n} \Sigma_{t=1}^{n} \Sigma_{\tau ≠t }^{n}E[U_{t}U_{\tau}\mathsf{X}_{t} \mathsf{X}_{\tau}^{T}]$$

  • 만약 오차항이 MDS라면 위 식에서 두번째 항은 0이 되므로, MDS인 경우의 그것과 같다.

5. HAC 추정량

 

  • 오차항이 시계열 상관을 가지는 경우, 분산이 다르게 정의되기 때문에 기존의 분산추정량을 사용해서는 안 된다. 이 경우 추정량의 극한 분포를 제대로 추정할 수 없고, 따라서 가설 검정이 불가능하다.

 

  • HAC 추정량, 즉 Heteroskedasticity-Autocorrelation-Consistent 추정량은 이분산과 오차의 시계열 상관 하에서도 견고한 분산 추정량을 제시한다.
  • HAC 추정량에는 정확한 해석적 해는 존재하지 않는다. 대표적인 방법으로, Newey and West가 제시한 추정량은 다음과 같다.

$$\hat{B}_{n} = \frac{1}{n}\hat{U}_{t}^{2}\mathsf{X}_{t} \mathsf{X}_{t}^{T}+\frac{1}{n-k}\Sigma_{l=1}^{m}w_{ml}\Sigma_{t=l+1}^{n}\hat{U}_{t}\hat{U}_{t-l}(\mathsf{X}_{t} \mathsf{X}_{t-l}^{T} + \mathsf{X}_{t-l} \mathsf{X}_{t}^{T})$$

where

$$w_{ml} = [1-\frac{l}{m+1}]$$

일반적으로,

$$m = 0.75n^{\frac{1}{3}}$$

 


6. GLS

 

  • 오차항에 시계열 상관이 존재하는 경우, HAC 추정량을 사용해 극한 분포를 구하는 데는 문제가 없다. 하지만 그렇게 구해진 추정량은 여전히 비효율적 추정량이라는 문제가 남아있다.

 

  • 이분산 문제가 있는 경우, 이분산의 구조를 모형화하여 동분산 가정을 복구하는 테크닉을 사용했다. 이러한 방법들을 GLS라고 했다.

 

  • 오차에 시계열 상관이 존재하는 경우에도 시계열 상관의 구조를 모형화하여 오차항이 독립적이도록 만들고 OLS를 적용할 수 있다. 마찬가지로 이 방법도 GLS라고 한다. GLS라는 것은 CLM 가정이 만족되도록 데이터 및 모형에 조작을 가한 후 OLS를 적용하는 테크닉들을 총칭한다.

 

  • Prais-Winstern이 제시한 GLS 방법은 오차의 시계열 상관을 다음과 같이 모형화한다.

$$U_{t} = \rho U_{t-1} + \epsilon_{t}$$

 

  • 이러한 상관 모형 하에서 시계열을 다음과 같이 변환하면 오차항의 시계열 상관이 제거된다고 한다.

$$Z_{t} = Y_{t}-\rho Y_{t-1} = \beta_{1}(X_{t1}-X_{t-1,1})+ \cdots + \beta_{k}(X_{tk}-X_{t-1,k}) + (U_{t}-\rho U_{t-1})$$

 

  • 이제 $Z_{t}$를 가지고 OLS를 하면 효율적인 베타 추정량을 구할 수 있다.

 

  • 단 일반적으로 $\rho$가 어떤 값인지는 모른다. 실용적으로는, 1차적으로 OLS를 한 다음에, OLS 오차항들을 가지고 AR 회귀식을 추정해서, $\rho$를 구하는 방법을 사용할 수 있을 것이다(FGLS의 일종).