시계열&계량경제학

계량경제학 #7 내생성 가정 하에서의 선형회귀 모형 (2): GMM

seungbeomdo 2023. 5. 23. 16:44

이전 글에 이어 내생성 문제에 관련된 몇 가지 심화된 이슈들을 다룬다.

 

 

계량경제학 #6 내생성 가정 하에서의 선형회귀 모형 (1): IV, TSLS

모형에 내생성 문제가 존재하는 경우, OLS 추정량은 더이상 모수에 대한 일치추정량이 아니다. 일치성이 지켜지지 않는 문제는 효율성이 지켜지지 않는 문제보다 훨씬 심각하다. 일치성이 지켜

seungbeomdo.tistory.com


 

3. GMM

 

  • 앞서 TSLS는 IV의 일반화된 형태이고, IV는 OLS의 일반화된 형태임을 설명했다.
  • 그런데 OLS, IV, TSLS는 모두 Least-Squared 방법의 일종이다. 즉 오차제곱합을 최소화하는 샘플 추정량 $\dot{\beta}_{n}$이다. 

$$\dot{\beta}_{n} = arg \, min _{\beta} \, \Sigma_{t=1}^{n}(Y_{t}-{X}_{t}^{T}\beta)^{2}$$

 

  • 오차제곱합을 최소화하기 위한 1계 조건(First order condition)은 

$$\Sigma_{t=1}^{n}Z_{t}(Y_{t}-X_{t}^{T}{\beta}_{n}) = \Sigma_{t=1}^{n}Z_{t}U_{t} = 0$$

 

  • 그런데 독립변수가 내생적인 경우에는, 이 1계 조건이 만족되지 않음을 알 수 있다.
  • 그래서 IV나 TSLS는 도구변수를 사용해 1계 조건을 다음과 같이 바꾼 것이라고도 이해할 수 있다.

$$\Sigma_{t=1}^{n}X_{t}(Y_{t}-X_{t}^{T}{\beta}_{n}) = \Sigma_{t=1}^{n}X_{t}U_{t} = 0$$

 

  • 주어진 샘플에는 noise가 존재하므로 1계 조건을 정확히 만족하는 해가 존재하지 않을 수 있다. 이 경우, 다음과 같은 비용함수를 최소화하는 문제로 바뀐다.

$$[\Sigma_{t=1}^{n}Q_{t}]^{T}\hat{W}_{n}[\Sigma_{t=1}^{n}Q_{t}]$$

  • where

$$Q_{t} = Z_{t}(Y_{t}-X_{t}^{T}\dot{\beta}_{n})$$ 

  • and $\hat{W}_{n}$ := $d*d$ 가중치 행렬

 

  • 즉 1계 조건을 최대한 가깝게 만족하는 수치적 해를 구하는 문제로 바꿀 수 있다.
  • 이러한 방법으로 구해진 추정량을 GMM(Generealized Method of Moment) 추정량이라고 총칭한다.

 

  • OLS, IV, TSLS는 각각 다음과 같은 조건 하에서의 GMM이다. 즉 세 가지 방법은 모두 GMM의 특수한 형태이다.
  • (1) OLS는 $Z_{t} = X_{t}$이고 $\hat{W}_{n}$가 항등행렬
  • (2) IV는 $Z_{t} ≠ X_{t}$이고 $\hat{W}_{n}$가 항등행렬
  • (3) TSLS는 $Z_{t} ≠ X_{t}$이고 $\hat{W}_{n} = [\frac{1}{n}\Sigma_{t=1}^{n}Z_{t}Z_{t}^{T}]^{-1}$

 

  • GMM 추정량은 Consistency와 Asymptotic normality를 모두 만족하므로, 가설검정에 사용할 수 있다.

 


 

4. Most Efficient Weight Matrix

  • GMM 추정량에서 도구변수는 외생성 조건을 만족시키기 위해 사용한다. 가중치 행렬은 추정량의 분산을 줄이기 위해, 즉 효율성을 개선시키기 위해 사용한다.

 

  • 다음과 같은 가중치 행렬 $\hat{W}_{n}$을 사용하면, 추정량이 가장 효율적이라는 사실이 증명되어있다.

$$\hat{W}_{n} = (\frac{1}{n}\Sigma_{t=1}^{n}\hat{U}_{t}^{2}Z_{t}Z_{t}^{T})^{-1}$$

 


 

5. Orthogonality Test

  • GMM을 할 때 도구변수가 유효하려면, 설정한 도구변수가 오차항과 직교해야 한다. 따라서 도구변수가 오차항과 직교하는지 확인해야 할 것이다.

 

  • 다음과 같은 귀무가설 하에서,

$$E[U_{t}Z_{t}] = 0$$

  • J-statistics는 점근적으로 카이제곱 분포를 따른다.

$$J_{n} = \frac{1}{\tilde{\sigma}_{n}^{2}}\tilde{\mathsf{U}}^{T}\mathsf{Z}(\mathsf{Z}^{T}\mathsf{Z})^{-1}\mathsf{Z}^{T}\tilde{\mathsf{U}} \sim ^{A} \chi{(d-k)}^{2}$$

  • where

$$\tilde{U}_{t} = Y_{t} - X_{t}^{T}\tilde{\beta}_{n}$$

$\tilde{\mathsf{U}} := \tilde{U}_{t}$로 구성된 $k*1$ 벡터

$k$:= 독립변수 벡터의 차원, $d$:= 도구변수 벡터의 차원

 

  • 만약 d=k이면 J-통계량의 값은 항상 0이 된다. IV 대신 TSLS나 GMM이 더 자주 사용되는 것은 J-test가 가능하기 때문이기도 하다.