시계열&계량경제학

패널 회귀 분석 #6 동태적 패널 모형의 IV 추정

seungbeomdo 2023. 11. 22. 20:22

  • 지난 편에서 보았듯이 동태적 패널 모형에 대해서는 임의효과 모형과 고정효과 모형이 항상 consistency를 만족하지 못한다.
  • 따라서 동태적 패널 구조를 고려한 대안적인 추정방법이 필요하다.

 

AH 추정: Anderson & Hsiao

  • 동태적 회귀모형을 1계 차분하면

$$\Delta Y_{it} =\Delta \mathsf{X}_{it}\beta + \rho \Delta Y_{i,t-1}+\Delta\epsilon_{it}$$

  • 위 모형에서 $E(\Delta Y_{i,t-1} \Delta \epsilon_{i,t})≠0$이므로, 도구변수 방법(IV)을 고려해야 한다. 그럼 어떤 변수를 도구변수로 사용해야 할까?

 

  • $\Delta Y_{i,t-1}$에 대한 도구변수는 $Y_{i,t-2}$를 사용하면 된다.
  • 어떤 변수가 내생변수에 대하여 적절한 도구변수가 되기 위해서는, (1) 오차항과 무관하고 (2) 내생변수와 상관을 가져야 하는데, $Y_{i,t-2}$는 두 조건을 모두 만족한다.
    • (1) $\Delta \epsilon_{it} = \epsilon_{it}-\epsilon_{i,t-1}$이고 이들은 t-2 시점의 $Y$와는 독립이다. 이 조건이 성립하려면 $Y_{i,t}$가 t+1 시점 이후의 오차와는 상관되지 않아야 한다(predetermined).
    • (2) $\Delta Y_{i,t-1} = Y_{i,t-1} - Y_{i,t-2}$이므로 $Y_{i,t-2}$는 $\Delta Y_{i,t-1}$과 상관된다.

 

  • $\Delta \mathsf{X}{it}$에 대한 도구변수는 $\Delta \mathsf{X}{it}$를 구성하는 독립변수들의 외생성 유형에 따라 다르다.
    • 강외생적인 독립변수 $\mathsf{X}_{1,it}$에 대해서는 자기 자신이 도구변수이다(즉, 도구변수 불필요).
    • 선결적인 독립변수 $\mathsf{X}_{2,it}$는 t-1기의 오차항과 상관되는 문제가 있으므로, $\mathsf{X}_{2,i,t-1}$을 도구변수로 사용한다.
    • 내생적인 독립변수 $\mathsf{X}_{3,it}$는 t기와 t-1기의 오차항과 모두 상관되므로, $\mathsf{X}_{3,i,t-2}$를 도구변수로 사용한다.

 

AB 추정 (Arellano and Bond) 또는 차분적률법

Motivation

  • 단순한 패널 AR(1) 모형을 생각해보자.

$$Y_{it} = \alpha + \rho Y_{i,t-1}+\mu_{i}+\epsilon_{it}$$

 

  • AH 추정량은 모형을 1계 차분한 후에 도구변수 $Y_{i,t-2}$를 사용해서 TSLS를 하는 것이다.

$$\Delta Y_{it} =\rho \Delta Y_{i,t-1}+\Delta\epsilon_{it}$$

 

  • TSLS 추정량이므로, AH 추정량은 먼저 $\Delta Y_{i,t-1}$를 $Y_{i,t-2}$으로 회귀시킨 후,

$$\Delta Y_{i,t-1} = \pi _ {0} + \pi_{1} Y_{i,t-2} + e_{i,t-1} \;\;\; \cdots \;\; (1)$$

  • 추정값 $\Delta \hat{Y}_{i,t-1}$에 대하여 $\Delta Y_{it}$를 회귀시키는 것이다.

 

  • AH 추정량의 한계는 식 (1)에서 오차항의 상관이 존재한다는 것이다.
  • 또한 TSLS 추정을 할 때 사용할 수 있는 도구변수는 시차 2 이상의 모든 과거 변수인데, 단지 하나의 과거 변수만을 사용한다는 것이다.

 

AB 추정의 구조

  • 대안으로, 차분적률법 또는 AB 추정법은 가능한 모든 도구변수를 사용하는 방법이다. 즉 시차 2 이상의 모든 과거변수를 TSLS의 도구변수로 사용한다.

 

  • 이때 문제는 시점 t마다 사용할 수 있는 도구변수의 개수가 다르다는 것이다.

 

  • 만약 $t = 1$이면,
  • $\Delta Y_{i1} =\rho \Delta Y_{i,0}+\Delta\epsilon_{i1}$에서 독립변수가 정의되지 않는다.

 

  • 만약 $t = 2$이면,
  • $\Delta Y_{i2} =\rho \Delta Y_{i1}+\Delta\epsilon_{i2}$에서 도구변수로 쓸 수 있는 것은 $Y_{i0}$

 

  • 만약 $t = 3$이면,
  • $\Delta Y_{i3} =\rho \Delta Y_{i2}+\Delta\epsilon_{i3}$에서 도구변수로 쓸 수 있는 것은 $Y_{i0}, Y_{i1}$

 

  • 이와 같은 식으로 도구변수의 수가 늘어난다. 그러므로 TSLS에서, 첫 번째 단계 회귀를 할 때 t에 따라 회귀모형이 달라진다.

 

  • 만약 $t = 2$이면 첫 번째 단계 회귀모형은
  • $\Delta Y_{i,1} = \pi _ {0,1} + \pi_{1,1} Y_{i,0} + e_{i,1}$

 

  • 만약 $t=3$이면 첫 번째 단계 회귀모형은
  • $\Delta Y_{i,2} = \pi_{0,2} + \pi_{1,2} Y_{i,1} + \pi_{2,2} Y_{i,0} + e_{i,2}$

 

  • 이런 방식으로, 시점 t에 따라 첫번째 단계의 회귀모형이 다르다.
  • 즉, AB 추정은 각 t에 대해 서로 다른 1단계 회귀를 적용한 후, 구해진 추정량으로 2단계 회귀를 적용한다.
  • 번거롭긴 하지만, 반복적으로 적절한 1단계 회귀 모형을 셋팅하여 오차항의 시계열적 상관을 제거할 수 있고 보다 효율적인 추정량을 얻는다.