ols 8

인과추론 방법 = 일관추정량을 구하는 방법

1. 인과추론 = OLS 회귀계수의 일관성을 보장할 수 있느냐공부시간이 성적에 미치는 인과영향을 구하기 위하여,공부시간 $X$에 대하여 성적 $Y$를 회귀시키는 방정식을 추정한다고 하자.$$Y_{i} = \alpha + \beta X_{i} + e_{i}$$where $e_{i} \sim ?(0, \sigma^{2})$ 이때 OLS 방법으로 추정된 회귀계수 $\hat{\beta}$가 공부시간의 순수한 인과영향(causal effect)인 $\beta$를 나타낸다고 말할 수 있을까? OLS 회귀계수는 샘플로부터 계산된 통계량이기 때문에 불가분한 노이즈들이 들러붙어 있다. 이 노이즈의 영향을 배제할 수 없기 때문에 우리는 섣불리 OLS 회귀계수가 인과영향을 곧바로 나타낸다고 말하지 못한다. 우리는 인과영향을..

계량경제학 #10 비정상 시계열 회귀분석 (1): Deterministic Time Trend

비정상 시계열이 가지는 일반적인 특징은 시간에 대한 추세이다. 모든 비정상 시계열이 추세를 가지는 것은 아니지만, 추세를 가지면 비정상 시계열이다. 비정상 시계열이 가지는 추세에는 두 가지 유형이 있다. 하나는 시간에 대하여 추세가 완벽히 예측가능한 Deterministic Trend와, 예측이 불가능한 Stochastic Trend이다. 이번 글에서는 Deterministic Trend가 존재하는 회귀 모델을 다룬다. 1. 모형의 가정 $$Y_{t} = \alpha_{*} + \beta_{*}t + \mathsf{Z}_{t}\gamma_{*} + U_{t}$$ where $\mathsf{Z}_{t}$는 k*1 벡터, $\{{\mathsf{Z}_{t}, U_{t}}\}$는 strictly stationa..

계량경제학 #9 자기상관 하에서의 선형회귀 모형 (2): HAC 추정량과 GLS

4. 오차항이 시계열적 상관을 가지는 경우 데이터셋이 시계열 상관을 가질 때, 오차항도 마찬가지로 시계열 상관을 갖는다고 하자. 이 경우에도 여전히 OLS 추정량은 Consistency를 만족한다. 이 시리즈에서 계속 얘기하듯이, 독립변수가 내생적이지만 않으면, OLS 추정량에는 그렇게 치명적인 문제(비일치성)는 없다. $$\hat{\beta}_{n} \rightarrow^{a.s.} \beta _{*}$$ 다만 OLS 추정량의 Asymptotic 분포를 구하기 위해서 추정량의 분산을 다르게 정의한다. $$\sqrt{n}(\hat{\beta}_{n} - \beta_{*}) \sim ^{A} N(0, E[\mathsf{X}_{t} \mathsf{X}_{t}^{T}]^{-1}BE[\mathsf{X}_{t} ..

계량경제학 #8 자기상관 하에서의 선형회귀 모형 (1): 시계열적 상관, Ergodicity, MDS

1. 시계열적 상관 고전적 선형회귀 모형을 구성하는 가정 중 하나는 데이터셋이 IID하다는 것이다. 즉 다음과 같은 임의의 두 데이터 포인트가 독립이고 동일한 분포를 가진다.$$[Y_{t}, X_{t1}, X_{t2}, … , X_{tk}], \, [Y_{\tau}, X_{\tau1}, X_{\tau2}, … , X_{\tau k}]$$ 그런데 대부분의 경제 데이터들, 특히 금융 시계열 데이터들은 IID 가정을 불충족한다. 특히 독립성 가정에 문제가 있다. 이러한 데이터들에는 시계열적 상관이 존재한다고 말한다. 이 글에서는 독립성은 불만족하지만, 정상성(Strict한 의미에서의 Stationary는 Identicalness와 동일하다)은 만족하는 데이터에 대한 OLS 추정을 다룬다. 2. Ergodic ..

계량경제학 #7 내생성 가정 하에서의 선형회귀 모형 (2): GMM

이전 글에 이어 내생성 문제에 관련된 몇 가지 심화된 이슈들을 다룬다. 계량경제학 #6 내생성 가정 하에서의 선형회귀 모형 (1): IV, TSLS 모형에 내생성 문제가 존재하는 경우, OLS 추정량은 더이상 모수에 대한 일치추정량이 아니다. 일치성이 지켜지지 않는 문제는 효율성이 지켜지지 않는 문제보다 훨씬 심각하다. 일치성이 지켜 seungbeomdo.tistory.com 3. GMM 앞서 TSLS는 IV의 일반화된 형태이고, IV는 OLS의 일반화된 형태임을 설명했다. 그런데 OLS, IV, TSLS는 모두 Least-Squared 방법의 일종이다. 즉 오차제곱합을 최소화하는 샘플 추정량 $\dot{\beta}_{n}$이다. $$\dot{\beta}_{n} = arg \, min _{\beta} \..

계량경제학 #6 내생성 가정 하에서의 선형회귀 모형 (1): IV, TSLS

모형에 내생성 문제가 존재하는 경우, OLS 추정량은 더이상 모수에 대한 일치추정량이 아니다. 일치성이 지켜지지 않는 문제는 효율성이 지켜지지 않는 문제보다 훨씬 심각하다. 일치성이 지켜지지 않을 경우, 모형을 추정하는 기본적인 목적(인과관계 파악)을 달성할 수 없기 때문이다. 애초에 추정된 회귀계수가 무엇을 추정하는 것인지도 알 수가 없다. 만약 내생성의 원인이 변수 누락에 있다면, 누락된 변수를 모형에 추가하면 된다. 누락된 변수를 구할 수 없다면 적당한 대리변수(proxy)를 사용하면 된다. 그런데 적당한 대리변수조차 찾을 수 없거나, 얼마나 많은 변수들이 누락된 것인지 알 수 없거나, 혹은 동시성의 문제가 존재하는 것이라면 아예 다른 해결방안을 찾아야 한다. 그 방법이 도구변수이다. 1. 도구변수..

계량경제학 #3 이분산 가정 하에서 OLS: HC 추정량과 FGLS

1. Heteroskedasticity 동분산성(Homoskedasticity)은 오차의 조건부 분산이 상수라는 것을 의미한다. $$E(U_{t}^{2}|\mathsf{X}_{t}) = \sigma_{*}^{2}$$ 독립변수 벡터의 조건부 평균은 독립변수 벡터의 함수이다. 따라서 동분산 가정은 오차의 조건부 분산이 독립변수 값에 따라 변화하지 않는다는 것을 의미한다. 만약 오차의 조건부 분산이 독립변수 값에 따라 변화한다면, 이분산성(Heteroskedasticity)이 존재한다고 말한다. 2. 모형의 가정 기본적으로 CLM의 가정과 동일하지만, 동분산성 가정만 제외한다. Asymptotic Theory의 세계를 다루고 있으므로, 정규성 가정도 불필요하다. 1) IID: Independently & Id..

계량경제학 #2 비정규 가정 하에서 OLS 추정량의 성질

CLM 모형의 가정 중 하나는 오차의 조건부 분포가 정규분포라는 것이다.오차의 조건부 분포에 대한 특별한 가정을 할 수 없는 경우에서 OLS 추정량의 성질을 알아본다.1. 모형의 가정기본적으로 CLM의 가정과 동일하지만, 정규성 가정만 제외된다.1) IID: Independently & Identically DistributedIID 가정은 데이터셋을 구성하는 각 벡터 [$Y_{t}$, $X_{t1}$, $X_{t2}$, ..., $X_{tk}$]가 독립적이고 동일한 확률분포를 갖는다는 것이다.2) 선형성: Linearity다음의 식을 성립시키는 $\beta_{*}$가 존재한다.$$E[Y_{t}|\mathsf{X}_{t}] = \mathsf{X}_{t}^{T}\beta_{*}$$3) 가역성: Invert..