이전 글에 이어 내생성 문제에 관련된 몇 가지 심화된 이슈들을 다룬다.
계량경제학 #6 내생성 가정 하에서의 선형회귀 모형 (1): IV, TSLS
모형에 내생성 문제가 존재하는 경우, OLS 추정량은 더이상 모수에 대한 일치추정량이 아니다. 일치성이 지켜지지 않는 문제는 효율성이 지켜지지 않는 문제보다 훨씬 심각하다. 일치성이 지켜
seungbeomdo.tistory.com
3. GMM
- 앞서 TSLS는 IV의 일반화된 형태이고, IV는 OLS의 일반화된 형태임을 설명했다.
- 그런데 OLS, IV, TSLS는 모두 Least-Squared 방법의 일종이다. 즉 오차제곱합을 최소화하는 샘플 추정량 $\dot{\beta}_{n}$이다.
$$\dot{\beta}_{n} = arg \, min _{\beta} \, \Sigma_{t=1}^{n}(Y_{t}-{X}_{t}^{T}\beta)^{2}$$
- 오차제곱합을 최소화하기 위한 1계 조건(First order condition)은
$$\Sigma_{t=1}^{n}Z_{t}(Y_{t}-X_{t}^{T}{\beta}_{n}) = \Sigma_{t=1}^{n}Z_{t}U_{t} = 0$$
- 그런데 독립변수가 내생적인 경우에는, 이 1계 조건이 만족되지 않음을 알 수 있다.
- 그래서 IV나 TSLS는 도구변수를 사용해 1계 조건을 다음과 같이 바꾼 것이라고도 이해할 수 있다.
$$\Sigma_{t=1}^{n}X_{t}(Y_{t}-X_{t}^{T}{\beta}_{n}) = \Sigma_{t=1}^{n}X_{t}U_{t} = 0$$
- 주어진 샘플에는 noise가 존재하므로 1계 조건을 정확히 만족하는 해가 존재하지 않을 수 있다. 이 경우, 다음과 같은 비용함수를 최소화하는 문제로 바뀐다.
$$[\Sigma_{t=1}^{n}Q_{t}]^{T}\hat{W}_{n}[\Sigma_{t=1}^{n}Q_{t}]$$
- where
$$Q_{t} = Z_{t}(Y_{t}-X_{t}^{T}\dot{\beta}_{n})$$
- and $\hat{W}_{n}$ := $d*d$ 가중치 행렬
- 즉 1계 조건을 최대한 가깝게 만족하는 수치적 해를 구하는 문제로 바꿀 수 있다.
- 이러한 방법으로 구해진 추정량을 GMM(Generealized Method of Moment) 추정량이라고 총칭한다.
- OLS, IV, TSLS는 각각 다음과 같은 조건 하에서의 GMM이다. 즉 세 가지 방법은 모두 GMM의 특수한 형태이다.
- (1) OLS는 $Z_{t} = X_{t}$이고 $\hat{W}_{n}$가 항등행렬
- (2) IV는 $Z_{t} ≠ X_{t}$이고 $\hat{W}_{n}$가 항등행렬
- (3) TSLS는 $Z_{t} ≠ X_{t}$이고 $\hat{W}_{n} = [\frac{1}{n}\Sigma_{t=1}^{n}Z_{t}Z_{t}^{T}]^{-1}$
- GMM 추정량은 Consistency와 Asymptotic normality를 모두 만족하므로, 가설검정에 사용할 수 있다.
4. Most Efficient Weight Matrix
- GMM 추정량에서 도구변수는 외생성 조건을 만족시키기 위해 사용한다. 가중치 행렬은 추정량의 분산을 줄이기 위해, 즉 효율성을 개선시키기 위해 사용한다.
- 다음과 같은 가중치 행렬 $\hat{W}_{n}$을 사용하면, 추정량이 가장 효율적이라는 사실이 증명되어있다.
$$\hat{W}_{n} = (\frac{1}{n}\Sigma_{t=1}^{n}\hat{U}_{t}^{2}Z_{t}Z_{t}^{T})^{-1}$$
5. Orthogonality Test
- GMM을 할 때 도구변수가 유효하려면, 설정한 도구변수가 오차항과 직교해야 한다. 따라서 도구변수가 오차항과 직교하는지 확인해야 할 것이다.
- 다음과 같은 귀무가설 하에서,
$$E[U_{t}Z_{t}] = 0$$
- J-statistics는 점근적으로 카이제곱 분포를 따른다.
$$J_{n} = \frac{1}{\tilde{\sigma}_{n}^{2}}\tilde{\mathsf{U}}^{T}\mathsf{Z}(\mathsf{Z}^{T}\mathsf{Z})^{-1}\mathsf{Z}^{T}\tilde{\mathsf{U}} \sim ^{A} \chi{(d-k)}^{2}$$
- where
$$\tilde{U}_{t} = Y_{t} - X_{t}^{T}\tilde{\beta}_{n}$$
$\tilde{\mathsf{U}} := \tilde{U}_{t}$로 구성된 $k*1$ 벡터
$k$:= 독립변수 벡터의 차원, $d$:= 도구변수 벡터의 차원
- 만약 d=k이면 J-통계량의 값은 항상 0이 된다. IV 대신 TSLS나 GMM이 더 자주 사용되는 것은 J-test가 가능하기 때문이기도 하다.
'시계열&계량경제학' 카테고리의 다른 글
계량경제학 #9 자기상관 하에서의 선형회귀 모형 (2): HAC 추정량과 GLS (1) | 2023.06.04 |
---|---|
계량경제학 #8 자기상관 하에서의 선형회귀 모형 (1): 시계열적 상관, Ergodicity, MDS (0) | 2023.05.26 |
계량경제학 #6 내생성 가정 하에서의 선형회귀 모형 (1): IV, TSLS (0) | 2023.05.21 |
계량경제학 #5 내생성 문제 (Endogeneity) (0) | 2023.05.20 |
계량경제학 #4 추정량의 효율성이 왜 문제일까 (0) | 2023.05.20 |