고정효과 모형의 가정
- 패널 회귀모형이 다음과 같이 주어졌다.
$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + U_{i,t}$$
$$U_{i,t} = \mu_{i} + \epsilon_{i,t}$$
$$\epsilon_{i,t} \sim i.i.d. (0, \sigma_{\epsilon}^{2})$$
$$E(\mu_{i} \epsilon_{i,t}) = 0$$
$$E(X_{i,t}\epsilon_{i,t})=0$$
- 이때, OLS 추정량이 모수를 일관적으로 추정하려면
$$E(U_{i,t}\mathsf{X}_{i,t}) = 0$$
- 이 조건이 성립하기 위해서는
$$E(\mu_{i}\mathsf{X}_{i,t}) = 0$$
$$E(\epsilon_{i,t}\mathsf{X}_{i,t})=0$$
- 개별효과 $\mu_{i}$가 $E(\mu_{i}\mathsf{X}_{i,t}) = 0$를 만족하지 못하는 오차 가정을 고정효과 모형(Fixed Effect Model)이라고 한다.
오차의 내생성
- 고정효과 모형에서는 개별효과가 독립변수와 상관되므로 POLS 방법으로 일관된 추정량을 구할 수 없다.
- 고정효과 모형에서는 이 문제를 해결하기 위해, 우선 개별효과를 고유오차와 분리하여 취급한다. 즉,
$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + \mu_{i} + \epsilon_{i,t}$$
$$\epsilon_{i,t} \sim i.i.d. (0, \sigma_{\epsilon}^{2})$$
$$E(\mu_{i} \epsilon_{i,t}) = 0$$
$$E(\epsilon_{i,t}\mathsf{X}_{i,t}) = 0$$
$$E(\mu_{i}\mathsf{X}_{i,t}) \neq 0$$
차분 방법
- 고정효과 문제를 해결하는 한 가지 방법은 고정효과를 모형에서 제거하는 것이다.
- 고정효과는 시간에 대해서는 불변하므로, 차분을 통해 모형에서 제거할 수 있다.
- 시간에 대하여 회귀방정식을 차분하면
$$\Delta Y_{i,t} = \Delta \mathsf{X}_{i,t}^{T}\beta + \Delta \mu_{i} + \Delta \epsilon_{i,t} = \Delta \mathsf{X}_{i,t}^{T}\beta + \Delta \epsilon_{i,t}$$
- 이때 독립변수가 고유오차에 대하여 외생적이므로, 차분된 변수 간에도 외생성이 성립한다.
- 따라서 위 회귀식을 가지고 POLS 추정을 하면 일치 추정량을 구할 수 있다.
고정효과 회귀
- 고정효과를 처리하는 보다 일반적인 방법은 집단 내 편차를 회귀시키는 것이다.
- 즉 개체 내에서 시간에 대한 평균에 대한 편차를 구한다.
- 원래의 회귀식은
$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + \mu_{i} + \epsilon_{i,t}$$
- 시간에 대한 평균 방정식은
$$\bar{Y}_{i} = \bar{\mathsf{X}}_{i}^{T}\beta + \mu_{i} + \bar{\epsilon}_{i}$$
- 고정효과는 시간에 대하여 불변하므로 시간에 대한 평균을 구해도 기존 값과 동일하다.
- 첫번째 식에서 두번째 식을 빼면,
$$(Y_{i,t} - \bar{Y}_{i})= (\mathsf{X}_{i,t}-\bar{\mathsf{X}}_{i})^{T}\beta + (\epsilon_{i,t}-\bar{\epsilon}_{i})$$
$$\tilde{Y}_{i,t} = \tilde{\mathsf{X}}_{i,t}^{T}\beta + \tilde{\epsilon}_{i,t}$$
- 마찬가지로, 위 식에 대해서 POLS를 구하면, 고정효과가 소거됐으므로 일치 추정량을 얻는다.
LSDV; 더미변수 회귀
- 고정효과 회귀 모형에서 아쉬운 점은 고정효과들을 따로 추정하지 않고, 모형에서 제거해버린다는 것이다.
- 독립변수의 영향력을 일관되게 추정할 수는 있지만, 개체마다 다른 고정효과들은 아예 추정할 수 없게 돼버린다.
- 더미변수 회귀 방법은 독립변수의 영향력을 일관되게 추정하면서, 동시에 고정효과까지 보존하는 방법이다.
- 더미변수 회귀식은 모든 개체에 대하여 더미변수를 추가하여 독립변수로 포함시킨다. 즉
$$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + \mu_{i} + \epsilon_{i,t}$$
- 이 모델은 원래 회귀식과 동일해보이지만, 개체가 i번째 변수일 때만 1의 값을 갖는 더미변수가 독립변수로 포함되었다.
- LSDV 방법에서는 고정효과가 관측된 독립변수로 포섭되었기 때문에, 외생성을 고려해야 할 오차는 고유오차뿐이다.
- 그리고 고유오차는 모형의 독립변수들과 모두 직교하므로 OLS 방법이 일치 추정량을 제공한다.
- 또한 개체마다 다른 개별효과까지 추정한다.
'시계열&계량경제학' 카테고리의 다른 글
패널 회귀 분석 #5 동태적 패널효과 모형과 내생성 (0) | 2023.11.22 |
---|---|
패널 회귀 분석 #4 정태적 패널효과 모형의 추가 이슈 (0) | 2023.11.22 |
패널 회귀 분석 #2 임의효과 모형 (Random Effect) (1) | 2023.06.14 |
패널 회귀 분석 #1 패널 데이터와 Unobserved Heterogeneity (0) | 2023.06.12 |
계량경제학 #12 비정상 시계열 회귀분석 (3): 가성회귀, 공적분, 오차수정모형 (0) | 2023.06.12 |