시계열&계량경제학

패널 회귀 분석 #3 고정효과 모형 (Fixed Effect)

seungbeomdo 2023. 6. 15. 22:39

고정효과 모형의 가정

 

  • 패널 회귀모형이 다음과 같이 주어졌다.

$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + U_{i,t}$$

$$U_{i,t} = \mu_{i} + \epsilon_{i,t}$$

$$\epsilon_{i,t} \sim i.i.d. (0, \sigma_{\epsilon}^{2})$$

$$E(\mu_{i} \epsilon_{i,t}) = 0$$

$$E(X_{i,t}\epsilon_{i,t})=0$$

 

  • 이때, OLS 추정량이 모수를 일관적으로 추정하려면

$$E(U_{i,t}\mathsf{X}_{i,t}) = 0$$

 

  • 이 조건이 성립하기 위해서는

$$E(\mu_{i}\mathsf{X}_{i,t}) = 0$$

$$E(\epsilon_{i,t}\mathsf{X}_{i,t})=0$$

 

  • 개별효과 $\mu_{i}$가 $E(\mu_{i}\mathsf{X}_{i,t}) = 0$를 만족하지 못하는 오차 가정을 고정효과 모형(Fixed Effect Model)이라고 한다.

오차의 내생성

 

  • 고정효과 모형에서는 개별효과가 독립변수와 상관되므로 POLS 방법으로 일관된 추정량을 구할 수 없다.

 

  • 고정효과 모형에서는 이 문제를 해결하기 위해, 우선 개별효과를 고유오차와 분리하여 취급한다. 즉,

$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + \mu_{i} + \epsilon_{i,t}$$

$$\epsilon_{i,t} \sim i.i.d. (0, \sigma_{\epsilon}^{2})$$

$$E(\mu_{i} \epsilon_{i,t}) = 0$$

$$E(\epsilon_{i,t}\mathsf{X}_{i,t}) = 0$$

$$E(\mu_{i}\mathsf{X}_{i,t}) \neq 0$$

 


차분 방법

 

  • 고정효과 문제를 해결하는 한 가지 방법은 고정효과를 모형에서 제거하는 것이다.

 

  • 고정효과는 시간에 대해서는 불변하므로, 차분을 통해 모형에서 제거할 수 있다.
  • 시간에 대하여 회귀방정식을 차분하면

$$\Delta Y_{i,t} = \Delta \mathsf{X}_{i,t}^{T}\beta + \Delta \mu_{i} + \Delta \epsilon_{i,t} = \Delta \mathsf{X}_{i,t}^{T}\beta + \Delta \epsilon_{i,t}$$

 

  • 이때 독립변수가 고유오차에 대하여 외생적이므로, 차분된 변수 간에도 외생성이 성립한다.
  • 따라서 위 회귀식을 가지고 POLS 추정을 하면 일치 추정량을 구할 수 있다.

고정효과 회귀

 

  • 고정효과를 처리하는 보다 일반적인 방법은 집단 내 편차를 회귀시키는 것이다.
  • 즉 개체 내에서 시간에 대한 평균에 대한 편차를 구한다.

 

  • 원래의 회귀식은

$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + \mu_{i} + \epsilon_{i,t}$$

 

  • 시간에 대한 평균 방정식은

$$\bar{Y}_{i} = \bar{\mathsf{X}}_{i}^{T}\beta + \mu_{i} + \bar{\epsilon}_{i}$$

  • 고정효과는 시간에 대하여 불변하므로 시간에 대한 평균을 구해도 기존 값과 동일하다.

 

  • 첫번째 식에서 두번째 식을 빼면,

$$(Y_{i,t} - \bar{Y}_{i})= (\mathsf{X}_{i,t}-\bar{\mathsf{X}}_{i})^{T}\beta + (\epsilon_{i,t}-\bar{\epsilon}_{i})$$

$$\tilde{Y}_{i,t} = \tilde{\mathsf{X}}_{i,t}^{T}\beta + \tilde{\epsilon}_{i,t}$$

 

  • 마찬가지로, 위 식에 대해서 POLS를 구하면, 고정효과가 소거됐으므로 일치 추정량을 얻는다.

LSDV; 더미변수 회귀

 

  • 고정효과 회귀 모형에서 아쉬운 점은 고정효과들을 따로 추정하지 않고, 모형에서 제거해버린다는 것이다.
  • 독립변수의 영향력을 일관되게 추정할 수는 있지만, 개체마다 다른 고정효과들은 아예 추정할 수 없게 돼버린다.

 

  • 더미변수 회귀 방법은 독립변수의 영향력을 일관되게 추정하면서, 동시에 고정효과까지 보존하는 방법이다.

 

  • 더미변수 회귀식은 모든 개체에 대하여 더미변수를 추가하여 독립변수로 포함시킨다. 즉

$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + \mu_{i} + \epsilon_{i,t}$$

 

  • 이 모델은 원래 회귀식과 동일해보이지만, 개체가 i번째 변수일 때만 1의 값을 갖는 더미변수가 독립변수로 포함되었다.

 

  • LSDV 방법에서는 고정효과가 관측된 독립변수로 포섭되었기 때문에, 외생성을 고려해야 할 오차는 고유오차뿐이다.
  • 그리고 고유오차는 모형의 독립변수들과 모두 직교하므로 OLS 방법이 일치 추정량을 제공한다.
  • 또한 개체마다 다른 개별효과까지 추정한다.