계량경제학 12

패널 회귀 분석 #1 패널 데이터와 Unobserved Heterogeneity

패널 데이터(Panel Data) 복수의 개체를 복수의 시점에서 관측한 데이터를 패널 데이터 횡단면 데이터(Cross-sectional): 복수의 개체를 하나의 시점에서 관측 시계열 데이터(Time-series): 하나의 개체를 복수의 시점에서 관측 패널회귀모델에서 변수는 2가지 차원의 변동이 가능하다. $$Y_{i,t} = \mathsf{X}_{i,t}^{T}\beta + U_{i,t}$$ $i$는 개체를, $t$는 시점을 나타내는 변수 반면 횡단면 혹은 시계열 데이터에서는 다음과 같은 회귀식 $$Y_{i} = \mathsf{X}_{i}^{T}\beta + U_{i}$$ Pooled OLS 패널데이터로 회귀분석을 실시하는 가장 단순한 방법은 패널의 구조를 무시하고 그냥 횡단면 데이터처럼 취급하여 OLS..

계량경제학 #12 비정상 시계열 회귀분석 (3): 가성회귀, 공적분, 오차수정모형

1. 가성 회귀 분석 Spurious Regression 종속변수 Y와 독립변수 X가 모두 Unit Root process인 경우를 생각하자. 이 경우에 다음과 같은 회귀모형을 상상할 수 있다. $$Y_{t} = \beta_{*} X_{t} + U_{t}$$ 그런데 $Y$와 $X$가 모두 Unit root process인 경우 $\beta_{*} = 0$이라는 귀무가설은 항상 기각된다. 즉 $X$가 실제로 $Y$에 통계적으로 유의한 영향력을 미치는지 여부와 무관하게, 항상 $X$가 유의한 독립변수로 나타난다. 이런 문제를 가성회귀 분석이라고 한다. 가짜 회귀분석이라는 뜻이다. 이런 회귀 모형을 세워서는 안 된다. 가성회귀 분석 문제에 대한 또다른 오해는 단지 $Y$와 $X$가 비정상 시계열일 때 가성회귀..

계량경제학 #11 비정상 시계열 회귀분석 (2): Stochastic Time Trend

비정상 시계열의 두번째 유형은 Stochastic Time Trend이다. 시간에 대하여 일정한 추세를 가지지 않는 Random Walk 모델이다.1. Random Walk Model Random Walk Model은 다음과 같이 정의한다.$$Y_{t} = Y_{t-1} + U_{t}$$ where $$U_{t} \sim IID \; (0, \sigma_{*}^{2})$$ AR(1) model에서 $\beta$가 1인 경우와 동일하기 때문에, unit root process라고도 부른다. Random walk model을 따르는 경우, 특별히 추정해야 할 모수가 없다. 그냥 랜덤워크 모델이다. 인과검정이나 예측이 불가능한 모델이다.따라서 주요한 관심사는 주어진 process가 랜덤워크를 따르는 것이 맞는..

계량경제학 #10 비정상 시계열 회귀분석 (1): Deterministic Time Trend

비정상 시계열이 가지는 일반적인 특징은 시간에 대한 추세이다. 모든 비정상 시계열이 추세를 가지는 것은 아니지만, 추세를 가지면 비정상 시계열이다. 비정상 시계열이 가지는 추세에는 두 가지 유형이 있다. 하나는 시간에 대하여 추세가 완벽히 예측가능한 Deterministic Trend와, 예측이 불가능한 Stochastic Trend이다. 이번 글에서는 Deterministic Trend가 존재하는 회귀 모델을 다룬다. 1. 모형의 가정 $$Y_{t} = \alpha_{*} + \beta_{*}t + \mathsf{Z}_{t}\gamma_{*} + U_{t}$$ where $\mathsf{Z}_{t}$는 k*1 벡터, $\{{\mathsf{Z}_{t}, U_{t}}\}$는 strictly stationa..

계량경제학 #8 자기상관 하에서의 선형회귀 모형 (1): 시계열적 상관, Ergodicity, MDS

1. 시계열적 상관 고전적 선형회귀 모형을 구성하는 가정 중 하나는 데이터셋이 IID하다는 것이다. 즉 다음과 같은 임의의 두 데이터 포인트가 독립이고 동일한 분포를 가진다.$$[Y_{t}, X_{t1}, X_{t2}, … , X_{tk}], \, [Y_{\tau}, X_{\tau1}, X_{\tau2}, … , X_{\tau k}]$$ 그런데 대부분의 경제 데이터들, 특히 금융 시계열 데이터들은 IID 가정을 불충족한다. 특히 독립성 가정에 문제가 있다. 이러한 데이터들에는 시계열적 상관이 존재한다고 말한다. 이 글에서는 독립성은 불만족하지만, 정상성(Strict한 의미에서의 Stationary는 Identicalness와 동일하다)은 만족하는 데이터에 대한 OLS 추정을 다룬다. 2. Ergodic ..

계량경제학 #7 내생성 가정 하에서의 선형회귀 모형 (2): GMM

이전 글에 이어 내생성 문제에 관련된 몇 가지 심화된 이슈들을 다룬다. 계량경제학 #6 내생성 가정 하에서의 선형회귀 모형 (1): IV, TSLS 모형에 내생성 문제가 존재하는 경우, OLS 추정량은 더이상 모수에 대한 일치추정량이 아니다. 일치성이 지켜지지 않는 문제는 효율성이 지켜지지 않는 문제보다 훨씬 심각하다. 일치성이 지켜 seungbeomdo.tistory.com 3. GMM 앞서 TSLS는 IV의 일반화된 형태이고, IV는 OLS의 일반화된 형태임을 설명했다. 그런데 OLS, IV, TSLS는 모두 Least-Squared 방법의 일종이다. 즉 오차제곱합을 최소화하는 샘플 추정량 $\dot{\beta}_{n}$이다. $$\dot{\beta}_{n} = arg \, min _{\beta} \..

계량경제학 #6 내생성 가정 하에서의 선형회귀 모형 (1): IV, TSLS

모형에 내생성 문제가 존재하는 경우, OLS 추정량은 더이상 모수에 대한 일치추정량이 아니다. 일치성이 지켜지지 않는 문제는 효율성이 지켜지지 않는 문제보다 훨씬 심각하다. 일치성이 지켜지지 않을 경우, 모형을 추정하는 기본적인 목적(인과관계 파악)을 달성할 수 없기 때문이다. 애초에 추정된 회귀계수가 무엇을 추정하는 것인지도 알 수가 없다. 만약 내생성의 원인이 변수 누락에 있다면, 누락된 변수를 모형에 추가하면 된다. 누락된 변수를 구할 수 없다면 적당한 대리변수(proxy)를 사용하면 된다. 그런데 적당한 대리변수조차 찾을 수 없거나, 얼마나 많은 변수들이 누락된 것인지 알 수 없거나, 혹은 동시성의 문제가 존재하는 것이라면 아예 다른 해결방안을 찾아야 한다. 그 방법이 도구변수이다. 1. 도구변수..

계량경제학 #5 내생성 문제 (Endogeneity)

1. 외생성: Exogeneity 외생성 조건은 다음과 같다. $$E[\mathsf{X}_{t}U_{t}] = 0$$ 외생성의 직관적 의미 외생성 조건은 모형의 독립변수가 외생적이라는 의미이다. 외생적이라는 것은 모형 바깥에서 이미 결정돼 주어진다는 의미이다. 즉 독립변수가 진짜 독립적인가?를 묻는 조건이다. 외생적이지 못한 독립변수는 내생적(Endogeneous)이라고 말한다. 외생성의 수식적 표현에서 볼 수 있듯이, 외생성이 존재하면 독립변수와 오차 간의 상관이 존재한다. 이는 독립변수가 오차에 영향을 주고, 혹은 오차가 독립변수에 영향을 주는 관계가 존재한다는 것이다. 독립변수는 우리가 모형 내에서 통제하는 요인이지만, 오차는 우리가 통제하지 못하는 요인이다. 통제되는 요인에 통제되지 않은 요인이 ..

계량경제학 #4 추정량의 효율성이 왜 문제일까

계량경제학 #3 이분산 가정 하에서 OLS: HC 추정량과 FGLS 1. Heteroskedasticity 동분산성(Homoskedasticity)은 오차의 조건부 분산이 상수라는 것을 의미한다. $$E(U_{t}^{2}|\mathsf{X}_{t}) = \sigma_{*}^{2}$$ 독립변수 벡터의 조건부 평균은 독립변수 벡터의 함수이다. 따라 seungbeomdo.tistory.com 이분산 가정 하에서 OLS 추정량은 Consistency를 만족하지만, 더이상 효율적인 추정량은 아니다. 즉 OLS 추정량보다 분산이 작은 추정량이 존재한다. 사실 OLS 추정량을 사용하더라도, 우리가 원하는 베타값에 대한 일치추정량을 구할 수 있다. 샘플 크기가 충분히 크다면 우리가 가지고 있는 추정량이 이미 베타값과 ..

계량경제학 #3 이분산 가정 하에서 OLS: HC 추정량과 FGLS

1. Heteroskedasticity 동분산성(Homoskedasticity)은 오차의 조건부 분산이 상수라는 것을 의미한다. $$E(U_{t}^{2}|\mathsf{X}_{t}) = \sigma_{*}^{2}$$ 독립변수 벡터의 조건부 평균은 독립변수 벡터의 함수이다. 따라서 동분산 가정은 오차의 조건부 분산이 독립변수 값에 따라 변화하지 않는다는 것을 의미한다. 만약 오차의 조건부 분산이 독립변수 값에 따라 변화한다면, 이분산성(Heteroskedasticity)이 존재한다고 말한다. 2. 모형의 가정 기본적으로 CLM의 가정과 동일하지만, 동분산성 가정만 제외한다. Asymptotic Theory의 세계를 다루고 있으므로, 정규성 가정도 불필요하다. 1) IID: Independently & Id..