시계열&계량경제학

패널 회귀 분석 #2 임의효과 모형 (Random Effect)

seungbeomdo 2023. 6. 14. 22:21

임의효과 모형의 가정

  • 패널 회귀모형이 다음과 같이 주어졌다.

$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + U_{i,t}$$

$$U_{i,t} = \mu_{i} + \epsilon_{i,t}$$

$$\epsilon_{i,t} \sim i.i.d. (0, \sigma_{\epsilon}^{2})$$

$$E(\mu_{i} \epsilon_{i,t}) = 0$$

$$E(X_{i,t}\epsilon_{i,t})=0$$

 

  • 이때, OLS 추정량이 모수를 일관적으로 추정하려면

$$E(U_{i,t}\mathsf{X}_{i,t}) = 0$$

 

  • 이 조건이 성립하기 위해서는

$$E(\mu_{i}\mathsf{X}_{i,t}) = 0$$

$$E(\epsilon_{i,t}\mathsf{X}_{i,t})=0$$

 

  • 개별효과 $\mu_{i}$가 $E(\mathsf{X}_{i,t}^{T}\mu_{i})=0$를 만족하는 오차 가정을 임의효과 모형(Random Effect Model)이라고 한다.

오차의 시계열적 상관

 

  • 임의효과 모형에서는 오차가 시계열적으로 독립적이라는 가정이 위배된다. 왜냐하면 개별 효과가 존재하기 때문이다.

$$E(U_{i,t}U_{i,s}) = E[(\mu_{i}+\epsilon_{i,t})(\mu_{i}+\epsilon_{i,s})]=E(\mu_{i}^{2})+R \neq 0$$

 

  • 임의효과 모형에서 $E(\mathsf{X}_{i,t}^{T}\mu_{i})=0$가 성립하기 때문에

$$E(U_{i,t}\mathsf{X}_{i,t}) = 0$$

  • 즉 독립변수의 외생성이 지켜진다. 따라서 임의효과 모형에서도 POLS 추정량은 일치추정량이다.

 

  • 사실 추정량의 가장 중요한 성질은 일치성이기 때문에, 임의효과 모형에서는 굳이 오차항을 개별 효과와 고유오차로 구분하지 않고 $U_{i,t}$로 사용한다.
  • 이를 특별히 합성오차(Composite Error)라고도 부른다.

 

  • 그러나 오차의 시계열적 상관이 존재하기 때문에 POLS 추정량은 더이상 효율적인 추정량이 아니다.

임의효과 모형의 추정

 

  • 임의효과 모형은 오차의 시계열적 상관 하에서도 효율적인 추정량을 제시하기 위해 다음과 같이 회귀구조를 변형한다.

$$Y_{i,t}-\theta \bar{Y_{i}} = (\mathsf{X}_{i,t}-\theta \bar{\mathsf{X}_{i}}) \beta + (U_{i,t} - \theta \bar{U_{i}})$$

  • $\bar{Y}_{i}$ 등은 시간에 대한 sample mean을 의미한다.

 

  • $\theta$는 변환된 오차항이 시계열적 상관이 존재하지 않도록 하는 일종의 커널(kernel)이다.

$$\theta = 1 - \frac{1}{\sqrt{1+T\frac{\sigma^{2}_{\mu}}{\sigma^{2}_{\epsilon}}}}$$

 

  • 위의 회귀식 하에서 OLS 추정량을 구하면, 시계열적 상관 하에서도 효율적인 추정량이 된다.

Between Estimator

 

  • RE 가정 하에서 사용할 수 있는 또다른 추정은 BE 방법이다.

 

  • 각 개체의 시간에 대한 평균을 구하여 회귀식을 추정하는 방법이다. 즉

$$\bar{Y}_{i} = \bar{\mathsf{X}}_{i}^{T}\beta + \bar{\epsilon}_{i}$$

 

  • BE 추정량의 $\beta$는 각 집단 간 평균적인 차이에 따른 Y의 평균적인 차이를 측정한다.